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От научного редактора 
перевода 


Микропроцессоры фирмы Intel в значитель¬ 
ной степени определяют направление развития 
компьютерной техники в последнее десятилетие. 
Каждые несколько лет фирма Intel демонстри¬ 
рует новые прорывы в своей технологии, суще¬ 
ственно меняя наши представления о возможно¬ 
стях компьютеризации. 

Предлагаемая читателю книга представляет 
собой последовательное изложение архитектур¬ 
ных особенностей и тонкостей программирова¬ 
ния микропроцессора i80386, пришедшего .на 
смену наиболее распространенному сегодня для 
класса персональных компьютеров процессора 
i80286. 

Новый процессор фирмы Intel представляет 
собой не только очередной шаг в повышении 
производительности микропроцессоров и степени 
их интеграции, но и содержит целый ряд прин¬ 
ципиально новых подходов, реализованных в 
его архитектуре. 

Профессиональные разработчики программ 
для многопроцессорных систем и систем с по¬ 
вышенными требованиями к надежности и за¬ 
щите программ найдут в этой книге самое под¬ 
робное изложение и примеры реализации соот¬ 
ветствующих механизмов i80386. 

В то же время, первые главы книги дают 
тот необходимый минимум вводной информа¬ 
ции, который позволит понять весь последую¬ 
щий материал и читателю, не имеющему спе¬ 
циальной профессиональной подготовки. 

В настоящее время фирма Intel начала сле¬ 
дующий этап наступления в повышении мощно¬ 
сти своих микропроцессоров. 

Процессор і8(3486 и следующие за ним 
І80586, І80686 (Р5 и Р6) обещают гораздо 
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большие возможности для программистов и 
проектировщиков систем. 

Изучение особенностей архитектуры и про¬ 
граммирования i80386 явится необходимым ша¬ 
гом, который в дальнейшем существенно упро¬ 
стит понимание новых идей программирования, 
закладываемых в перспективные изделия фирмы 
Intel. 

А. С. Карнаухов 



Глава 1 


ВВЕДЕНИЕ В ЯЗЫК 
АССЕМБЛЕР 


С микропроцессором 80386 могут работать програм¬ 
мисты самого различного уровня. Некоторые из них яв¬ 
ляются системными программистами, имеющими доста¬ 
точные навыки в области написания операционных сис¬ 
тем, драйверов устройств и больших ассемблерных про¬ 
грамм. Другие больше знакомы с языками высокого 
уровня типа Бейсик или Паскаль, но мало пользовались 
языком ассемблер. Эта глава познакомит читателей с 
наиболее важными понятиями в программировании на 
языке ассемблер. 

Сначала рассматривается формат ассемблерного опе¬ 
ратора, затем обсуждаются типы чисел, используемых 
при программировании на языке ассемблер. Большинство 
программистов знают их, но они потребуются в дальней¬ 
шем и потому приведены. Если вы раньше программиро¬ 
вали микропроцессоры фирмы Intel, эту главу можно 
пропустить. Но если материал окажется для вас новин¬ 
кой, его нужно внимательно изучить. 


1.1. ЯЗЫК АССЕМБЛЕР 

Команда пересылки MOV АХ,ВХ является примером 
типичного ассемблерного оператора. Первое слово MOV 
является ассемблерной командой, т. е. прямым приказом 
от программиста компьютеру. Так что же здесь пересы¬ 
лается? 

АХ и ВХ являются регистрами, т. е. запоминающи¬ 
ми ячейками внутри 80386. Число из регистра ВХ пере- 
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сылается в регистр АХ. После выполнения этой команды 
в обоих регистрах будет находиться одно и то же зна¬ 
чение. 

Каждая непустая строка в ассемблерной программе 
содержит «команду» или «директиву», наиболее важными 
частями которой являются сама команда и ее операнды. 
Команда выполняет некоторую операцию, используя дан¬ 
ные в своих операндах. Другие части команд и дирек¬ 
тив рассматриваются далее. 

Например, команда MOV АХ,ВХ имеет два опе¬ 
ранда. 

Большинство двухоперандных команд имеют формат 
вида: 


КОМАНДА Получатель Источник 

Так выглядят, например, арифметические команды 
сложения ADD или вычитания SUB. Команда берет свой 
второй операнд, выполняет некоторую операцию с при¬ 
влечением первого операнда (например, их сложение) и 
сохраняет результат в первом операнде. Результат заме¬ 
няет то значение, которое имелось ранее в первом опе¬ 
ранде. 

Многие команды имеют неявные операнды, напри¬ 
мер, команда CLC означает «сбросить бит переноса», 
т. е. сбросить флажок CF в ноль. Значение операнда 
(бит переноса) подразумевается самой командой. Операн¬ 
дами команд могут быть отдельные биты в регистрах 
микропроцессора, байты, слова и двойные слова или лю¬ 
бые из этих элементов в основной памяти компьютера 
(подробнее о составе компьютера см. гл. 2). 

Обычно компьютер выполняет команды в том по¬ 
рядке, в котором они следуют в программе. Но иногда 
такой порядок нужно изменить, например, чтобы повто¬ 
рить цикл. Для этого применяются следующие команды: 

JCC Loop Тор 


Loop Top: MOV АХ,ВХ ; Верх цикла 


JZ 


Loop Тор 
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Выражение Loop Тор является меткой команды 
MOV АХ,ВХ. Точка с запятой в этой же строке указы¬ 
вает на наличие комментария, который находится за 
ней. Многоточия заменяют операции, которые для нас 
здесь интереса не представляют. 

Команда JCC (переход, если перенос сброшен) про¬ 
веряет бит переноса и, если он содержит 0, передает 
управление команде MOV АХ,ВХ, отмеченной мет¬ 
кой «Loop Тор». Команда JZ (переход, если нуль) ана¬ 
логична команде JCC, но проверяет бит нулевого ре¬ 
зультата. 

Обобщенный ассемблерный оператор имеет такую 
форму: 

Метка: КОМАНДА Операнд (ы) ; Комментарий 

Метка и комментарий не обязательны, а число опе¬ 
рандов зависит от вида команды. Единственной обяза¬ 
тельной частью оператора является сама команда. Если 
в строке содержится только метка, то она относится к 
команде в следующей строке. 

Описания основных типов команд микропроцессора 
80386 приведены в главе 3. Кроме команд и операндов 
в языке ассемблер есть несколько других элементов, ко¬ 
торые поясняются далее. 


1.1.1. Префиксы команды 


Префикс заставляет команду действовать несколько 
иначе, чем она выполняется без префикса. Важным пре¬ 
фиксом является LOCK, который помогает одному из 
процессоров 80386 обращаться к области памяти, разде¬ 
ляемой несколькими процессорами; еще один важный 
префикс REP вызывает повторение команды. Префиксы 
расширяют строку ассемблерной программы: 

Метка: ПРЕФИКС КОМАНДА Операнд(ы); Комментарий 

Примером служит команда: 


One Loop: REP MOVSB Dest,Source ; Пересылает байты 
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Эта команда пересылает заданное число байт (число 
содержится в одном из регистров микропроцессора) из 
одной области памяти в другую. 

1.1.2. Директивы ассемблера 

Приведенные выше команды преобразуются в ма¬ 
шинные команды для микропроцессора. Ассемблер точно 
определяет форму команды, чтобы она производила нуж¬ 
ное программисту действие. 

Иногда нам нужно сообщить ассемблеру заранее, 
что мы собираемся делать. Если, например, все наши 
элементы данных являются словами, а мы не хотим, 
чтобы компьютер пересылал двойные слова. Директивы 
ассемблера похожи на обычные команды, но не трансли¬ 
руются в машинный код, сообщающий микропроцессору, 
что делать дальше. Вместо этого директивы сообщают 
ассемблеру, как интерпретировать команды и директивы, 
следующие за ними, показывая, где начинается и конча¬ 
ется программа, и выполняя множество других функций. 

Например, в любой программе есть переменные. 
Директивы, сообщающие ассемблеру имена переменных, 
имеют следующий вид: 

Имя Директива Начальное значение ; Комментарий 

Приведем пример: 

MyAge DB 29 ; Директива определения данных 

DB 0 ; Второй байт со значением О 

Директива сообщает ассемблеру, что при обращении 
программы к переменной MyAge оно производится к 
байту и начальное значение байта равно 29. К байту, 
зарезервированному в следующей строке, можно обра¬ 
щаться как MyAge +І, что означает «байт после байта с 
MyAge». Как видно из приведенного примера, имя в на¬ 
чале строки директивы не обязательно. 

Другой важной директивой ассемблера является 
EQU, которая сообщает ассемблеру о необходимости 
присвоить числу определенное имя. Например, следую¬ 
щая директива сообщает ассемблеру, что при встрече в 
программе слова Retire следует использовать число 62: 

Retire EQU 62 
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Отметим, что директива DB сообщает ассемблеру 
о необходимости поместить определенное значение (29) 
в заданный байт памяти, а директива EQU требует 
не забывать заменять слово Retire на значение 62 
при трансляции программы на машинный язык. При 
необходимости изменить значение Retire можно внести 
директиву: 

Retire EQU 65 

При повторном ассемблировании программы при 
каждой встрече слова Retire оно будет заменено на 65. 

Подробную информацию о директивах можно полу¬ 
чить из документации на используемый вами ассемб¬ 
лер, и ее нужно внимательно изучить. Директивы 
определяют, как программа размещается в памя¬ 
ти, и могут помочь придать программе структуру, напо¬ 
минающую структуру программы на языке вы¬ 
сокого уровня. 


1.1.3. Ассемблерная арифметика 


В командах и директивах ассемблера могут вычис¬ 
ляться значения выражений. Если ассемблер встречает 
выражение (например, RETIRE-3) там, где ожидается 
наличие числа, ассемблер выполняет необходимые ариф¬ 
метические операции и помещает результат в программу 
на машинном языке. Если, например, с помощью дирек¬ 
тивы EQU мы сообщаем, что Retire равно 65, то следу¬ 
ющая команда передаст Retire+5 (т. е., 65+5=70) в ре¬ 
гистр АХ: 

MOV АХ, Retire+5 

Не следует забывать, что определение значения 
«Retire+5» осуществляется при ассемблировании програм¬ 
мы, поэтому в ассемблерной арифметике можно исполь¬ 
зовать только те числа, которые определены до ассемб¬ 
лирования данного оператора. Точное описание ассемб¬ 
лерной арифметики можно найти в документации на 
конкретную версию ассемблера. 
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1.1.4. Что делает язык ассемблер 

Вы можете спросить: «Так в чем же разница между 
языком ассемблер и языком высокого уровня?» Хотя 
структура ассемблерных операторов своеобразна, но даже 
приведенные простые примеры показывают наличие в 
программе циклов, передачи управления, условных пере¬ 
ходов и переменных, т. е. тех элементов, которые свой¬ 
ственны для языков высокого уровня. 

Главная особенность языка ассемблер заключается в 
том, что каждая его команда транслируется ровно в од¬ 
ну команду машинного языка. В языках же высокого 
уровня каждый оператор может транслироваться в про¬ 
извольное число команд машинного языка (иногда в од¬ 
ну, но часто в 5 и более в зависимости от вида опера¬ 
тора и контекста). 

Вторая важная особенность ассемблера состоит в 
том, что программист может прямо именовать регистры 
микропроцессора и абсолютные адреса в памяти. Когда 
программист пишет на Бейсике LET А=В, он не знает, 
где находятся числа. Запись MOV АХ,ВХ позволяет про¬ 
граммисту точно знать, что он делает. 

Исполнение команды MOV зависит от вида операн¬ 
дов. Главным является общее действие команды, при ко¬ 
тором значение кода копируется из одного участка па¬ 
мяти в другой. В этой книге описаны общие действия 
команд и их точные форматы. 

Часто говорят, что программирующий на ассемблере 
может делать все, что делает программист на языке вы¬ 
сокого уровня и еще кое-что сверх того. Программист 
должен точно знать команды и структуры данных. Даже 
плохо написанная ассемблерная программа будет, в об¬ 
щем, выполняться быстрее хорошо написанной програм¬ 
мы на языке высокого уровня, но только тщательно на¬ 
писанная ассемблерная программа приближается к про¬ 
грамме на языке высокого уровня по читаемости (для 
людей) и легкости сопровождения. 


1.1.5. Ассемблирование 80386 

Посмотрим на листинг 1.1, чтобы более точно уяс¬ 
нить, что делает ассемблер с небольшим фрагментом ас¬ 
семблерного кода. 
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Листинг 1.1. Пример ассемблерной программы 


GenRegs EQU 8 

1: число общих регистров 80386 

RegsUsed DB 0 

2: число использованных регист- 


ров 

DoMore 

Код, который фиксирует данные 
в общих регистрах и производит 
инкремент RegsUsed, когда ре¬ 
гистр используется 

CMP RegsUsed,GenRegs 

3: все регистры использованы? 

JNE DoMore 

4: если нет, продолжать цикл 


Ассемблер транслирует код из листинга 1.1 на ма¬ 
шинный язык процессора 80386, образуя исполняемый 
код. Строка 1 с директивой EQU сообщает ассемблеру о 
необходимости подставлять число 8 там, где встречается 
слово «GenRegs». 

Строка 2 с директивой DB сообщает ассемблеру, 
что данный байт в памяти назван RegsUsed и имеет 
начальное значение 0. 

Строка 3 содержит требование сравнить значение в 
RegsUsed, которое может быть изменено в предыдущих 
строках, с числом 8, представляющим GenRegs. 

В результате обработки указанных директив ассемб¬ 
лер образует следующий машинный код в 16-ричном 
формате: 

80 ЗЕ ?? 08 

Это означает: сравнить (код инструкции 80) байт в 
указанной ячейке памяти (ЗЕ ??) с абсолютным значе¬ 
нием числа (8, как определено директивой EQU). Фла¬ 
жок нулевого результата будет установлен в 1, если эти 
два числа равны. 

Тонким моментом здесь является неопределенность 
значения смещения (??), которое задается режимом ад¬ 
ресации, используемым для нахождения байта в памяти 
(см. гл. 4). 

Строка 4 сообщает процессору о необходимости про¬ 
должить выполнение программы с метки DoMore, если 
инструкция СМР показывает, что два числа не равны. 
На машинном языке эта операция выглядит так: 
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75 XX 

Здесь код 75 означает «короткий переход» к ячейке 
памяти в диапазоне -128/+127 байт, если условие «не 
равны» удовлетворяется (флажок нулевого результата в 
состоянии 0). Значение XX — это число байт до ячей¬ 
ки, которое равно числу байт между командой с меткой 
DoMore и командой JNE. 

Листинг 1.2 показывает процесс ассемблирования; 
он содержит ассемблерный код и результат на машин¬ 
ном языке. 

Листинг 1.2. Процесс ассемблирования 


Язык ассемблер 


Машинный язык 

GenRegs 

EQU 

8 


RegsUsed 

DB 

0 

0 

DoMore 





CMP 

RegsUsed,GenRegs 

80 ЗЕ ?? 08 


JNE 

DoMore 

75 XX 


Далее в книге приводятся кодовые эквиваленты 
всех команд процессора 80386 и режимы адресации, а 
также листинги ассемблирования на машинном языке. 


1.2. МАШИННЫЕ ЧИСЛА 

1.2.1. Представление данных в компьютере 

В самом компьютере применяется исключительно 
двоичная система счисления. Компьютер внутри можно 
представить набором переключателей, которые могут на¬ 
ходиться в двух позициях 0/1, Вкл/Выкл, Истина/Ложь. 
Каждый такой переключатель называется битом. Для то¬ 
го, чтобы описать состояние сразу нескольких бит, их 
значения выписываются последовательно (1001, 10110, 

10001001001). 
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Обычно биты организуются в группы по 8, называ¬ 
емые байтами. Последнее число можно записать как 
00000100 01001001 и говорить о значениях в первом и 
во втором байте. 

Более компактную форму обеспечивает 16-ричная 
запись, в которой каждая цифра показывает состояние 
группы из 4 бит. Цифры 16-ричной системы приведены 
в листинге 1.3. 


Листинг 1.3. Двоичные, десятичные и 16-ричные цифры 


Набор 

Десятичный эквивалент 

16-ручный эквивалент 

Вес 8421 

0000 

0 

0 

0001 

1 

1 

0010 

2 

2 

ООП 

3 

3 

0100 

4 

4 

0101 

5 

5 

ОНО 

б 

6 

0111 

7 

7 

1000 

8 

8 

1001 

9 

9 

1010 

10 

А 

1011 

11 

В 

1100 

12 

С 

1101 

13 

D 

1110 

14 

Е 

1111 

15 

F 


Байт можно представить двумя 16-ричными цифра¬ 
ми: 11000001 равен С1, а 10001001 равен 89. Обычно 
использование 16-ричной системы счисления отмечается 
завершающей буквой Н. 

Разряды двоичных чисел имеют веса, равные степе¬ 
ни 2: 

двоичное число 10101010 

степень 2 76543210 

Самый правый разряд имеет вес 1, следующий пе¬ 
ред ним 2 1 -2 и т. д. до 2 7 —128. 
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1.2.2. Представление чисел 

Для представления непривычных и неудобных для 
людей двоичных чисел применяется двоично-кодирован¬ 
ный десятичный или BCD -формат. Процессор 80386 
обеспечивает аппаратную поддержку BCD -арифметики 
командами «Коррекция ASCII», которые используют ре¬ 
гистр AL для выполнения операций BCD -арифметики 
над двумя числами одновременно. 

В «упакованном BCD -формате» 4 бита представляют 
одну цифру 0-9. Из 16 возможных комбинаций исполь¬ 
зуются только десять. При попытке производства ариф¬ 
метических операций с такими числами встречаются 
трудности, так как компьютер автоматически считает их 
двоичными числами и иногда дает результат, не имею¬ 
щий смысла для BCD -чисел, например, двоичная опера¬ 
ция: 

1000(8 BCD)+0100(4 BCD)=1100<? BCD) 

Сумма равна 12, но такой десятичной цифры нет. Мы 
хотим, чтобы компьютер автоматически сформировал пе¬ 
ренос, когда результат сложения двух BCD -цифр больше 
9. BCD -операция: 

1000(8 BCD)+0100(4 BCD)=0001 0010(12 BCD) 

Необходимая коррекция осуществляется специальной 
командой. Отметим, что в байте могут храниться две 
BCD -цифры и диапазон представления чисел составляет 
от 00 до 99. В то же время байт может содержать 256 
комбинаций; следовательно, в BCD -формате память ис¬ 
пользуется не полностью. 

BCD -формат допускает представление больших чи¬ 
сел несколькими байтами и применяется в финансовых 
расчетах, где нет чисел, состоящих из более, чем 15 
разрядов. 

Но для больших чисел требуется и формат с фик¬ 
сированным числом байт. Это формат с плавающей точ¬ 
кой. Обычно операции над такими числами производятся 
с помощью заранее написанных программ, и вам необя¬ 
зательно знать тонкости работы с такими числами. 

32-битное число с плавающей точкой может иметь 
следующий формат: 

первый бит: знак мантиссы, 
следующие 8 бит: порядок, 
следующие 23 бита: мантисса. 
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Предполагается, что число представляется в форме: 
((+/-) 1. мантисса) *(2 (+/ * порядок)) 

Достоинство использования. чисел с плавающей точ¬ 
кой состоит в том, что в 32 битах представляются чис¬ 
ла из огромного диапазона: примерно от 10 ( ~ 38) до 
10(+38) Но представление с плавающей точкой оказыва¬ 
ется неточным, и числа с плавающей точкой обычно яв¬ 
ляются округленными числами. Точность можно повы¬ 
сить, увеличивая число бит до 64 или 80, но все же 
потеря точности остается. 


1.3. ДВОИЧНАЯ АРИФМЕТИКА 

Сложение одноразрядных двоичных чисел подчиня¬ 
ется простым правилам: 0+0=0, 0+1=1, 1+0=1, 1+1=0 и 
перенос 1. Действуя по этим правилам, можно сложить 
два любых числа, начиная с младших разрядов. Слож¬ 
ность возникает только при учете переносов, но она 
легко преодолевается, например: 

1 1 0 0 0 11 0 

+ 

110 1111 


10 0 110 10 1 

Вычитание двоичных чисел несколько труднее сло¬ 
жения, таблица двоичного вычитания имеет вид: 

0-0 = 0 
0-1 = 1, заем 1 
1-0=1 
1-1=0 

Применяя эти правила к отдельным разрядам, мож¬ 
но вычитать любые числа, начиная с младших разрядов. 
Необходимо правильно учитывать заемы, например: 

110 0 110 

1 1 0 0 0 1 


110 10 1 



24_ Введение в язык ассемблер _ 

1.3.1. Отрицательные двоичные числа 

До сих пор мы пользовались только положительны¬ 
ми двоичными числами и применяли для их представле¬ 
ния нужное нам число разрядов: старший бит всегда со¬ 
держал 1, так как левые нули бесполезны. Но в боль¬ 
шинстве систем требуется обрабатывать положительные и 
отрицательные числа, и старшая 1 всегда показывает от¬ 
рицательное число. Для этого договорились о том, что 
длина всех чисел — 8 бит и необходимо записывать да¬ 
же незначащие старшие нули. 

Отрицательные числа в компьютерах и в микропро¬ 
цессоре 80386 представляются в дополнительном коде, 
так как в нем простые правила применимы к положи¬ 
тельным и отрицательным числам. В дополнительном ко¬ 
де запись положительных чисел совпадает с их обычной 
записью, например, 4 равно 00000100, а нуль равен 
00000000. 

Для образования дополнительного кода отрицатель¬ 
ного числа необходимо сначала построить положительное 
число с таким же абсолютным значением, а затем ин¬ 
вертировать каждый бит и прибавить 1 к результату. 
Приведем два примера: 

десятичное число -4 -11 

положительное двоичное число 00000100 00001011 

инверсия каждого бита 11111011 11110100 

прибавление 1 11111100 11110101 

Отметим, что старший бит является знаковым. Для 
преобразования отрицательного числа в дополнительном 
коде в десятичное следует вначале превратить его в по¬ 
ложительное двоичное число (инвертировать все биты и 
прибавить 1), а затем положительное двоичное число 
превратить в десятичное. 

В дополнительном коде правила двоичной арифме¬ 
тики применимы к положительным и отрицательным 
числам, например: 


1 1 0 0 1 0 0 0 

(-56) 

1110 1111 

(-17) 

+ 

0 110 10 0 1 

(+105) 

0 0 0 0 0 0 1 1 

(+3) 

0 0 1 1 0 0 0 1 

(+49) 

1110 110 0 

(-20) 
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Арифметические правила для отрицательных чисел 
такие же, как и для положительных (т. е, беззнако¬ 
вых), с которыми мы имели дело ранее. Далее в книге 
число в дополнительном коде называется также знако¬ 
вым числом, т. е. в нем старший бит является знако¬ 
вым. 


1.3.2. Переполнение и перенос 

При выполнении арифметических операций, напри¬ 
мер сложения или вычитания, процессор 80386 исполь¬ 
зует сумматор, работающий очень быстро — до 8 млн 
простых сложений в секунду. 

Однако иногда даже простые операции типа сложе¬ 
ния вызывают трудности. При сложении беззнаковых 
чисел результат может быть слишком большим для име¬ 
ющегося числа байт. Например, 10000001 (129) + 
01111111 (127) = 100000000 (256) и результат не поме¬ 
щается в 8 бит. Сумматор сформирует неверный резуль¬ 
тат 00000000. 

Чтобы преодолеть возникшую трудность, сумматор 
устанавливает дополнительный внутренний бит — фла¬ 
жок переноса. Флажок устанавливается в 1, если ре¬ 
зультат сложения не помещается в число бит, отведен¬ 
ное для суммы, а в противном случае сбрасывается в 0. 

В знаковом числе только младшие 7 бит содержат 
значение числа, а старший бит содержит знак. Эквива¬ 
лент переноса (значение слишком велико для представ¬ 
ления) возникает, когда сложение двух 7-битных чисел 
дает результат, не помещающийся в 7 бит. Например, 
01111100 (+124) + 00001111 (+15) * 10001011 (-11), что 
неверно. Такое изменение старшего бита называется пе¬ 
реполнением. В процессоре 80386 есть флажок перепол¬ 
нения, который устанавливается в 1, когда результат в 
младших 7 битах изменяет восьмой бит, и сбрасывается 
в 0 в противном случае. Переполнение можно игнориро¬ 
вать для беззнаковых чисел. Таким образом, перенос 
вызывается переносом из левого бита, а переполнение 
вызывается изменением- старшего бита. 

Точные условия установки флажков имеют большое 
значение. В микропроцессоре 80386 есть и другие флаж¬ 
ки, состояния которых зависят от результата арифмети¬ 
ческой операции (см. гл. 2). 
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1.3.3. Знаковое расширение 

Пока мы говорим о числах, представимых в одном 
байте. Микропроцессор 80386 допускает также примене¬ 
ние слов (два байта) и двойных слов (4 байта). Часто 
требуется преобразовать байт в слово или двойное слово. 

Эта задача решается легко для положительных чи¬ 
сел — нужно просто добавить нули слева. Например, 
байт 00010011 (19) становится словом 00000000 00010011 
(тоже 19). Отрицательные числа в дополнительном коде 
преобразуются сложнее. Если добавить нули слева в от¬ 
рицательное число, оно совершенно изменится, напри¬ 
мер, 11101101 (-19) превратится в 00000000 11101101 
(237). К счастью, имеется простое правило знакового 
расширения, по которому меньшие операнды превраща¬ 
ются в большие с сохранением величины и знака. Необ¬ 
ходимо взять знаковый бит меньшего типа данных и по¬ 
вторить его слева нужное число раз. Например, байт 
11101101 (-19) превращается в слово 11111111 11101101 
(-19). Микропроцессор 80386 допускает операции знако¬ 
вого и нулевого расширения при преобразовании байта в 
слово или в двойное слово и слова в двойное слово. 


1.3.4. Двоичная логика 

В листинге 1.4 показаны действия логических опе¬ 
раций на различные комбинации бит. 


Листинг 1.4. Двоичная логика 


NOT 0 - 1 
0 AND 0-0 
0 OR 0 - 0 
0 XOR 0-0 


NOT 1 - 0 
0 AND 1 - 0 
0 OR 1 - 1 
0 XOR 1 - 1 


1 AND 0-0 
1 OR 0 - 1 
1 XOR 0 - 1 


1 AND 1 - 1 
1 OR 1 - 1 
1 XOR1 - 0 


Эти двоичные операции применимы не только к би¬ 
там, но и к байтам. Нужно выстроить два байта как 
для сложения, а затем применить правила к каждой па¬ 
ре бит. Так как переносов нет, операции можно начи- 
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нать слева или справа (см. листинг 
операции выполняются над операндами 
наковой длины. 

1.5). Логические 
любой, но оди- 

Листинг 1.5. 

Применение логических операторов 


NOT 

AND 

OR 

XOR 

01010110 

11001010 

11001010 

11001010 


01010110 

01010110 

01010110 

10101001 

01000010 

11011110 

10011100 




Глава 2 


АРХИТЕКТУРА 
ПРОЦЕССОРА 80386 


В этой главе речь пойдет об архитектуре процессо¬ 
ра 80386 с точки зрения программирования. В параграфе 
2.1 дается краткая история появления 80386 и обсужда¬ 
ются общие функции типичного микропроцессора. Глава 
рассчитана на прикладных программистов; в ней описа¬ 
ны все регистры 80386, включая и те, которые обычно 
используются только операционными системами. Рассмот¬ 
рены также прерывания и их особые случаи. 

Программа 80386 в режиме виртуального процессора 
8086 работает почти так же, как и в реальном режиме; 
оба режима позволяют реализовать на 80386 программы 
и операционные системы для 8086, а также программы 
реального режима процессора 80286. 

Программы, работающие в защищенном режиме, 
имеют доступ ко всем средствам реального режима, а 
также к средствам защищенного режима. Понимание из¬ 
ложенного далее материала необходимо для использова¬ 
ния всех режимов и возможностей 80386. 

В параграфе 2.2 дана эволюция семейства 8086. 
Она помогает лучше понять систему команд 80386 и по¬ 
казывает перспективу. Затем обсуждаются компоненты 
микропроцессора. Основной материал касается внутрен¬ 
ней организации 80386, структуры памяти, типов дан¬ 
ных и режимов адресации памяти. Рассмотрены все ре¬ 
гистры и режимы адресации. Опытные программисты, 
знающие 8086 и 80286, могут пропустить часть материа¬ 
ла данной главы. 
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2.1. ЭВОЛЮЦИЯ МИКРОПРОЦЕССОРОВ 
ФИРМЫ INTEL 

Первый универсальный микропроцессор 4004 фирмы 
Intel появился в 1971 г. Он мог выполнять любую про¬ 
грамму из системы своих команд, мог ввести данные, 
обработать их и вывести результаты. Длина слова этого 
микропроцессора составляла всего 4 бита (тетрада). Он 
был ориентирован на применение в калькуляторах. Мик¬ 
ропроцессор содержал около 1000 транзисторов и выпол¬ 
нял 8000 операций в секунду. 

Через несколько лет фирма Intel- выпустила микро¬ 
процессор 8008 (аналог 4004 с длиной слова 8 бит) и 
8080 (достаточно мощный для построения небольшого 
компьютера). Микропроцессор 8080 (который применяет¬ 
ся и сейчас) может выполнять десятичные и 16-битные 
арифметические операции, вызывать подпрограммы и ад¬ 
ресовать память до 64 Кбайт. Шина данных имеет раз¬ 
мер 8 бит, а шина адреса — 16 бит. 

Группа инженеров фирмы Intel образовала фирму 
Zilog, которая в 1976 г. выпустила популярный микро¬ 
процессор Z80. По сравнению с 8080 он имеет дополни¬ 
тельные регистры и команды. Большинство программ 
8080 могут выполняться на Z80. В компьютерах с попу¬ 
лярной операционной системой СР/М может применять¬ 
ся любой из этих микропроцессоров.' 

Аналогичные 8-битные микропроцессоры выпустили 
и другие фирмы: Motorola (6800) и Mos Technology 
(6502, применяемый в компьютерах Apple II). 

В 1980, г. фирма Motorola выпустила 16/32-битный 
процессор 68000, который работает с 16-битными данны¬ 
ми, но имеет возможность внутренней обработки 32 бит 
и адресует память 4 Гбайт. Быстродействие процессора 
около 800 тыс. оп/сек. Его преемниками стали процессо¬ 
ры 68010, 68020 и 68030, по возможностям приближаю¬ 
щиеся к миникомпьютерам. Семейство 68000 в настоя¬ 
щее время составляет основную конкуренцию семейству 
8086. 

За 10 лет число транзисторов в микропроцессоре 
увеличилось в 70 раз, размер слова составил 16 бит, а 
быстродействие возросло в 100 раз. Хотя уже были до¬ 
стигнуты некоторые физические ограничения для кри¬ 
сталлов, рынок стимулировал аналогичное развитие и в 
80-е годы, примером чего служит процессор 80386. 
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2 . 2 . СЕМЕЙСТВО 8086 

В 1978 г. начат выпуск микропроцессора 8086, а 
через год — 8088. Размер слова 16 бит (как внутри 
кристалла, так и при обмене с памятью через внешнюю 
шину). 

Размер адресной шины 20 бит, что позволяет пря¬ 
мо адресовать память 1 Мбайт, но только блоками по 
64 Кбайт. 

Микропроцессор 8088 аналогичен 8086, но имеет 
шину данных всего 8 бит. Когда ему требуется 16-бит¬ 
ное значение, приходится передавать его в два приема 
по 8 бит, что ухудшает быстродействие. Но во внутрен¬ 
ней обработке и при работе с байтами процессор 8088 
аналогичен по быстродействию 8086; его достоинство — 
возможность работы с дешевыми микросхемами памяти 
по 8 бит и другими устройствами, созданными для ста¬ 
рых микропроцессоров. В книгах и документации часто 
говорят о «8086» или «базовой архитектуре». Это озна¬ 
чает, что для сохранения совместимости другие члены 
семейства должны эмулировать 8086. Микропроцессор 
8088 аналогичен 8086 во всем, кроме размера слова. 
Поэтому указание на 8086 означает «8086» и «8088» 
(без специальной оговорки). 

При обсуждении реального режима 80386 в основ¬ 
ном речь будет идти о возможностях 8086. В 80386 рас¬ 
ширена система команд и добавлены регистры. Однако 
переход от 8086 к реальному режиму 80386 должен 
быть вполне понятен. 


2.3. ОСНОВА МИКРОПРОЦЕССОРОВ 

Сердцем любого компьютера является модуль цент¬ 
рального процессора (CPU) со схемами арифметико-логи¬ 
ческого устройства (ALU). Микропроцессор — это CPU 
в виде одной или нескольких больших интегральных 
схем. Небольшие размеры микропроцессора являются су¬ 
щественным фактором, но еще важнее его дешевизна, 
что и позволяет установить низкие цены на компью¬ 
теры. 

С точки зрения программиста микропроцессор рабо¬ 
тает так же, как любой CPU. В состав CPU входят 
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ALU для производства арифметических операций и уст¬ 
ройство управления, которое управляет движением дан¬ 
ных в компьютере. Для повышения быстродействия в со¬ 
став CPU включают регистры, т. е. быстродоступные 
ячейки памяти. Некоторые из регистров доступны для 
программистов, а другие только для устройства управ¬ 
ления. 

В состав компьютера входит также память, содер¬ 
жащая программы и данные. Память состоит из запоми¬ 
нающего устройства с произвольной выборкой (RAM), в 
которое можно записывать и из которого можно считы¬ 
вать, и постоянного запоминающего устройства (ROM), 
из которого можно только считывать. Содержимое RAM 
исчезает при выключении питания или перезапуске ком¬ 
пьютера, а содержимое ROM никогда не изменяется. Че¬ 
рез порты ввода-вывода (ІО) данные пересылаются меж¬ 
ду CPU и внешними устройствами. Основные элементы 
компьютера показаны на рис. 2.1. 

Различие между памятью и портами ІО несущест¬ 
венно, так как ІО допускается представлять в виде яче¬ 
ек памяти: содержимое ячеек RAM управляет тем, что 
выводится (дисплей) или вводится (клавиатура). В этом 
случае ІО осуществляется операциями записи и считыва¬ 
ния соответствующих ячеек памяти. Для многих про¬ 
грамм ІО сводится к операциям с дисковыми накопите¬ 
лями; для этого вызываются программы операционной 
системы, которые осуществляют передачи данных, вы¬ 
полняя код ROM. 

Пересылки данных в компьютере осуществляются по 
командам устройства управления в CPU через шину 
данных (это параллельный тракт между CPU, памятью 
и портами ІО). Регистры и ALU подсоединены с одной 
стороны шины данных, а память и ІО — с другой. Уст¬ 
ройство управления помещает данные на шину и считы¬ 
вает их с шины. 

Размер слова CPU (16 или 32) бита относится 
к числу бит его внутренних регистров. Важное значе¬ 
ние имеет и ширина шины данных. CPU 8086 счита¬ 
ется 8/16-битным, так как его шина данных 8-битная, 
а внутренние регистры 16-битные. CPU 80386 — это 
«истинно 32-битный» компьютер, так как ширина 
шины и размер регистров составляют 32 бита. 
Размер шины адреса также имеет 32 бита, что 
упрощает вычисление адреса (адрес хранится в одном 
регистре). 



32 


Архитектура процессора 80386 



Рис. 2.L Общие компоненты компьютера 


Внутри 80386 находятся CPU (с ALU и регистрами) 
и устройство управления памятью. Основная память и 
порты ІО находятся вне микропроцессора. 

Здесь мы не рассматриваем временную диаграмму 
работы, управляющие сигналы, взаимодействие с па¬ 
мятью, физическую организацию схемных плат компью¬ 
тера и др. Многие аппаратные вопросы затронуты в гла¬ 
ве 7. 
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2.4. БАЗОВЫЙ ЦИКЛ В 80386 

Большинство современных компьютеров выполняют 
команды последовательно. Для каждой команды реализу¬ 
ются следующие действия: команда выбирается из. памя¬ 
ти, дешифрируется (преобразуется во внутренний микро¬ 
код CPU) и выполняется ее микрокод. В результате по¬ 
лучается цикл выборки, дешифрирования и исполнения. 

Одновременно с этим в компьютере производятся и 
другое действия. При выборке команды производится ав¬ 
томатический инкремент регистра, называемого програм¬ 
мным счетчиком PC. Он сообщает CPU, где искать сле¬ 
дующую команду. При инкременте PC команды выпол¬ 
няются в том порядке, в каком они хранятся в памяти. 
Только при «переходе» или «вызове» подпрограммы в 
PC загружается новое значение, и следующая команда 
выбирается из новой указанной ячейки. 

Операнды многих команд хранятся в памяти. На¬ 
пример, команда ADD суммирует два числа, одно из 
которых находится в памяти. Его нужно передать для 
обработки из памяти в CPU. Следовательно, базовый 
цикл дополняется операциями инкремента PC и считы¬ 
вания операнда из памяти. Команды, использующие опе¬ 
ранд из памяти, выполняются дольше. 

В CPU 80386 это усложнение преодолевается с по¬ 
мощью «конвейеризации». Пока одна команда выбирает¬ 
ся из памяти, вторая дешифрируется, а третья исполня¬ 
ется. Обычно в конвейере одновременно находятся 5 или 
6 команд, т. е. по завершению одной команды в микро¬ 
процессоре 80386 сразу начинается исполнение следую¬ 
щей, которая уже выбрана из памяти и дешифрирована. 

2.4.1. Процессор 80386 

Процессор состоит из нескольких функциональных 
устройств («блоков»). Программист может прямо управ¬ 
лять только операционным устройством EU, которое со¬ 
держит внутренние регистры и ALU, а также контролле¬ 
ром, который вызывает исполнение команд. Важнейшим 
элементом компьютера является основная память, обыч¬ 
но в виде RAM. Далее мы подробнее остановимся на 
регистрах 80386 и взаимодействии с памятью. Именно 
это представляет наибольший интерес для прикладного 
программиста. 


2 Зак. 
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Операционное устройство содержит быстродействую¬ 
щий 32-битный сумматор и 64-битный параллельный 
сдвигатель, который может сдвигать 32-битный операнд 
на 31 бит в любом направлении. Суммирование и 
сдвиг — это быстрые команды, особенно если операнды 
находятся в регистрах CPU. 


2.4.2. Программируемые регистры 

Большинство регистров 80386 используются приклад¬ 
ными программистами, и только часть их использует¬ 
ся системными программистами. Программируемые реги¬ 
стры включают в себя регистры общего назначения, 
регистры сегментации, регистры флажков и указателя 
команды. 

Некоторые регистры 80386 входят в «базовый реги¬ 
стровый набор». Это группа регистров, которые есть в 
каждом процессоре семейства 80386. В нее входят млад¬ 
шие 16 бит прикладных регистров и слово состояния 
(см. гл. 6). 

Регистров общего назначения всего 8; они содержат 
по 32 бита. Имена полных 32-битных регистров начина¬ 
ются с буквы Е (Extended — расширенный): ЕАХ, ЕВХ, 
ЕСХ, EDX, EBP, ESI, EDI и ESP. Младшие 16 бит 
каждого из этих регистров можно указывать так же, 
как и в прежних CPU: АХ, ВХ, СХ, DX, BP, SI, DI и 
SP. Наконец, первые четыре 16-битных регистра можно 
адресовать парами байтных регистров: АН и AL для АХ, 
DH и DL для DX, ВН и ВК для ВХ, СН и CL для СХ 
(см. рис. 2.2 и 2.3). 

Все регистры адресуются как двойные слова, т. е. 
как 32-битные регистры. В двухсловном регистре одна 
команда (например, MOV ЕАХ,1) оперирует всем двой¬ 
ным словом. Младшая половина каждого регистра адре¬ 
суется как слово (16-битный регистр). В двухсловный 
регистр можно загрузить слово в младшую половину, не 
влияя на старшие 16 бит. Когда нужно обращаться к 
регистру в 32- или 16-битной формах (как удобнее про¬ 
граммисту), мы помещаем в скобках букву Е; например, 
(Е)АХ означает «ЕАХ или АХ-что нужно». Первые че¬ 
тыре регистра допускают в младшей половине адресацию 
байт. 
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Рис. 2.2. Регистры данных 80386 (общего назначения) 

Каждый из регистров общего назначения имеет спе¬ 
циализированное применение. В командах типа ADD 
программист может указывать в качестве операндов лю¬ 
бые два регистра. В операциях PUSH предполагается, 
что стек адресует регистр SP. 

Покажем назначение каждого регистра: 

(Е)АХ — аккумулятор, применяется в десятичной 
арифметике; 

(Е)ВХ — регистр базы, применяется как база при 
вычислении адреса; 

(Е)СХ — счетчик, применяется как счетчик в цик¬ 
лических операциях; 

(E)DX — регистр данных, хранит данные для не¬ 
скольких операций; 

(E)SP — указатель стека, содержит смещение вер¬ 
шины стека; 
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Рис. 2.3. Регистры указателя и индексации 


(Е)ВР — указатель базы, может содержит базу об¬ 
ласти данных; 

(E)SI и (E)DI — индексы источника и получателя, 
применяются для адресации смещения. 

Подробнее об использовании каждого регистра см. 
главу 4. 

Регистры сегментации применяются для определе¬ 
ния начальных смещений в памяти области кода и дан¬ 
ных. Каждый из шести этих регистров имеет свое на¬ 
значение. CS адресует программный код, DS — данные 
программы, SS — ее стек. Дополнительные регистры 
ES, TS, FS и GS предназначены для структур данных; 
из них только ES используется в конкретных командах 
(см. рис. 2.4). 
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Рис. 2.4. Сегментные регистры 

Прикладные программы обычно не обращаются к 
регистрам сегментации, ими полностью управляет опера¬ 
ционная система. Содержимое регистров сегментации 
вместе с другими регистрами определяет, где находится 
следующая команда (CS плюс указатель команды), где 
вершина стека (SS плюс ESP) и т. д. Способ объедине¬ 
ния содержимого регистров зависит от режима, в кото¬ 
ром работает программа. 

Еще два регистра — это регистр флажков EFIags, 
который управляет некоторыми операциями и показыва¬ 
ет текущее состояние процессора 80386, и указатель ко¬ 
манды, который используется вместе с CS для адреса¬ 
ции следующей команды. Программисту доступны только 
некоторые биты в регистре флажков, а указатель коман¬ 
ды модифицируется только при переходах и вызовах. 

2.5. РЕГИСТР ФЛАЖКОВ 

Регистр флажков EFIags процессора 80386 содержит 
32 бита. Прикладные программы работают только с 
младшими 16 битами EFIags. Биты в EFIags отражают 
состояние 80386 и управляют выполнением некоторых 
операций. 

Различают три типа флажков: системные флажки 
(они отражают текущее состояние компьютера в целом 
и чаще используются операционной системой, а не при¬ 
кладными программами), флажки состояния (показывают 
состояние конкретной программы) и флажки управления 
(прямо влияют на некоторые команды). Формат регистра 
флажков приведен на рис. 2.5. 
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Рис. 2.5. Регистр флажков 


2.5.1. Резерв фирмы Intel 

Некоторые биты регистра флажков зарезервированы 
фирмой Intel; биты 31—18 всегда содержат 0. Биты 15, 
5 и 3 ранее всегда содержали 0, а бит 1 всегда содер¬ 
жит 1. Если в ваших программах используются зарезер¬ 
вированные биты, то программы на данном CPU 80386, 
по-видимому, будут работать, но могут и не работать в 
последующих версиях микросхемы. 


2.5.2. Системные флажки 


ФЛАЖОК ѴМ — ВИРТУАЛЬНЫЙ РЕЖИМ 

0 = защищенный режим; 1 = режим виртуального 80386. 

Этот флажок показывает, работает ли ваша про¬ 
грамма в режиме виртуального 80386 (см. гл. 5). Обыч¬ 
но вы не можете проверить этот бит (и следующий) в 
реальном режиме. 


ФЛАЖОК R — ВОЗОБНОВЛЕНИЕ 

0 = нет ошибки; 1 = ошибка отладки. 

Этот флажок временно включает средства отладки, 
когда программа возобновляет работу после особого слу¬ 
чая отладки. 
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ФЛАЖОК NT — ВЛОЖЕННАЯ ЗАДАЧА 

О = текущая задача не вложена; 1 = текущая задача 
вложена. 

Этот флажок показывает, выполняется ли текущая 
задача «под» некоторой другой задачей; он влияет на 
выполнение команды IRET. 


ФЛАЖОК IOPL — УРОВЕНЬ ПРИВИЛЕГИИ 
ВВОДА/ВЫВОДА (БИТЫ 13 И 12) 

О = текущая задача имеет высший приоритет; 
1 = следующий ниже; 2 = следующий ниже; 
3 = низший приоритет. 

Два бита IOPL используются процессором и опера¬ 
ционной системой для определения прав доступа при¬ 
кладной программы к средствам ввода/вывода. Допусти¬ 
мые уровни варьируются от 0 (наиболее привилегиро¬ 
ванные) до 3 (наименее привилегированные). 


ФЛАЖОК I — ПРЕРЫВАНИЕ 

О = внешние прерывания запрещены; 1 = разрешены. 

Этот флажок определяет, будет ли CPU реагировать 
на внешние прерывания или игнорирует их. Он не 
влияет на особые случаи прерывания (порождаемые про¬ 
граммой) и немаскируемые внешние прерывания. Про¬ 
граммы в мультизадачных системах должны избегать 
воздействия на этот флажок. 


ФЛАЖОК Т — ТРАССИРОВКА 

О = нет трассировки; 1 = прерывание после каждой ко¬ 
манды. 

Этот флажок вызывает генерирование особого слу¬ 
чая прерывания по каждой команде; применяется для 
покомандной работы при отладке. 
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2.5.3. Флажки состояния 


Флажки состояния (прямо используемые прикладны¬ 
ми программами) устанавливаются многими командами 
80386, особенно арифметическими. 

Программист может проверить флажок для опреде¬ 
ления последующих действий программы. Хотя каждый 
флажок имеет общую функцию, точный смысл его зави¬ 
сит от последней выполненной команды. 

ФЛАЖОК О — ПЕРЕПОЛНЕНИЕ 

0 = нет переполнения; 1 = возникло переполнение. 

Этот флажок устанавливается в 1, если результат 
арифметической операции превышает доступные пределы; 
если этого нет, флажок переполнения сбрасывается в 0. 

ФЛАЖОК S — ЗНАК 

0 = старший бит содержит 0; 1 = старший бит содер 

жит 1. 

Значение этого флажка совпадает со старшим битом 
результата. Для знаковых чисел этот бит показывает 
знак результата: 1 = отрицательный, 0 = положитель¬ 
ный. 

ФЛАЖОК Z — НУЛЬ 

0 = последний ненулевой результат; 1 = последний ре¬ 
зультат был нулевым. 

Этот флажок устанавливается в 1 (истина), если 
результат операции нуль, и сбрасывается в 0 (ложь), 
если результат ненулевой. 

ФЛАЖОК А — КОРРЕКЦИЯ ИЛИ 
ВСПОМОГАТЕЛЬНЫЙ ПЕРЕНОС 

0 = нет внутреннего переноса; 1 = внутренний перенос. 

Этот флажок показывает состояние «внутреннего» 
переноса или заема (при сложении и вычитании) из би¬ 
та 3 в бит 4 — межтетрадный перенос или заем. 
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ФЛАЖОК Р — ПАРИТЕТ 

О = младший байт имеет четный паритет; 1 = младший 
байт имеет нечетный паритет. 

Состояние этого флажка зависит от младшего байта 
результата: если он содержит четное число единиц, то 
Р = 1, а в случае нечетного числа единиц Р = 0. 

ФЛАЖОК С — ПЕРЕНОС 

0 = нет переноса из старшего бита; 1 = есть перенос. 

Показывает, вызвали ли сложение или вычитание 
перенос или заем из старшего бита результата. 


2.5.4. Флажки управления 

Флажки управления действуют только на цикличе¬ 
ские команды. 


ФЛАЖОК D — НАПРАВЛЕНИЕ 

0 = автоинкремент; 1 = автодекремент в циклических 
командах. 

Этот флажок управляет «направлением» операций. 
Когда D = 0, циклы обрабатываются от младших адре¬ 
сов к старшим, а когда D - 1, обработка производится 
от старших адресов к младшим. 


2.6. ПЛОСКАЯ И СЕГМЕНТИРОВАННАЯ 
ПАМЯТЬ 

В процессоре 8086 адреса образуются из 16-битного 
селектора сегмента и 16-битного смещения. Селектор 
сдвигается влево на 4 бита и при суммировании двух 
чисел получается 20-битный адрес, как показано на 
рис. 2.6. 
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( Рис. 2.6. Сложение селектора и смещения для получения 
20-байтного адреса 

Области программ и данных состоят из сегментов. 
Например, при запуске основного блока программы в CS 
загружается начальное значение кода программы, а ука¬ 
затель команды устанавливается на 0. По мере выполне¬ 
ния команд производится инкремент программного счет¬ 
чика. Команды JMP и CALL загружают в указатель ко¬ 
манды новые значения, но CS не изменяется. Так как 
содержимое индекса команды ограничено 2 16 -1, то мак¬ 
симальный размер сегмента программы равен 64 Кбайт. 
Области программы и данных могут занимать несколько 
сегментов по 64 Кбайт, но 20-байтный адрес ограничи¬ 
вает память до 2 20 или 1 Мбайт. Операционная система 
DOS не., может адресовать более 640 Кбайт. 

Ограничения размера сегментов и памяти являются 
трудной проблемой для программ и систем на базе 8086. 
Например, структура данных не может быть более 
64 Кбайт без включения двух или более сегментов. 
Программа, работающая с такой структурой, должна по¬ 
стоянно контролировать достижение границы сегмента и 
в нужное время переключаться на новый сегмент. Такой 
контроль и переключение сильно замедляют доступ к 
большим структурам. Например, для избежания мерца¬ 
ния экрана необходимо очень быстро осуществлять его 
регенерацию. На экране 1024x1024 пиксела каждый из 
них описывается байтом (включен, выключен, мерцание 
и яркость даже для нецветного экрана). Следовательно, 
для поддержки экрана нужно иметь RAM 1 Мбайт, что 
намного больше размера сегмента; только такую память 
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и может адресовать 8086, не оставляя места для про¬ 
грамм и данных. 

Адреса данных образуются с привлечением регистра 
DS (иногда и ES) и смещения; адреса для стековых 
операций формируются на основе содержимого регистров 
SS и SP. Но в любом случае максимальный размер сег¬ 
мента равен 64 Кбайт. 

В реальном режиме процессоры 80286 и 80386 рабо¬ 
тают аналогично. Однако в защищенном режиме все из¬ 
меняется. В 80386 с привлечением 32-битных регистров 
можно реализовать модель плоской памяти. 

В этой модели нет сегментов (или есть один огром¬ 
ный сегмент). Память считается единой и неразрывной. 
Такая модель применяется в микропроцессоре 68000 и 
других. Для резализации этой модели в 80386 нужно 
просто установить все сегментные регистры на нуль. 
Размер всех регистров для смещений (ЕІР, ESP и дру¬ 
гие общие регистры) равен 32 битам. Это допускает ад¬ 
ресацию 2" байт или 4 Гбайт, что в 4000 раз больше, 
чем диапазон адресации 8086. 

По желанию в защищенном режиме 80386 можно 
использовать и модель сегментированной памяти, как в 
8086. Однако метод вычисления адреса оказывается дру¬ 
гим. Сегментные регистры не суммируются со смещения¬ 
ми, а используются как селектор или указатель в спи¬ 
ске «дескрипторов сегментов». Дескриптор содержит важ¬ 
ную информацию о сегменте, включая его базовый ад¬ 
рес и длину (подробнее см. гл. 5). 


2.6.1. Регистры управления, проверки 
и отладки 

Данные регистры обычно не используются приклад¬ 
ными программами. Однако назначение их нужно пони¬ 
мать, так как они применяются для поддержки операци¬ 
онной системы, параллельных процессов, отладки и дру¬ 
гих компонентов среды, в которой разрабатываются и 
выполняются программы. 

Имеются четыре регистра управления, доступные 
только по команде MOV. Например, команда MOV 
EAX,CR0 загружает в ЕАХ содержимое CR0 первого ре¬ 
гистра управления; команда MOV CR3,EBX передает со¬ 
держимое ЕВХ в CR3 — третий регистр управления. 
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Данные варианты команды MOV можно использовать 
только на уровне привилегий 0. Регистр CKO также 
содержит несколько важных флажков. 

ФЛАЖОК PG — РАЗРЕШЕНИЕ СТРАНИЦ (БИТ 31) 

0 - нет страниц; 1 - есть страничная организация. 

Когда PG-1, процессор использует таблицы страниц, 
которые применяются для работы с виртуальной па¬ 
мятью и других целей, определяя нужный адрес. Когда 
РОО, таблица страниц не используется. 

ФЛАЖОК ЕТ — ТИП СОПРОЦЕССОРА (БИТ 4) 

0 - 16-битный сопроцессор 80287; 1 = 32-битный сопро¬ 
цессор 80387. 

Состояние этого флажка сообщает 80386 о типе 
имеющегося сопроцессора — 80287 или 80387'. В первом 
случае применяется 16-битный протокол, а во втором 
32-битный. 

ФЛАЖОК TS — ЗАДАЧА ПЕРЕКЛЮЧЕНА (БИТ 3) 

0 “ нет переключения задачи; 1 - задача переключена. 

Когда TS-1, произошло переключение задачи. Этот 
флажок влияет на команды сопроцессора и некоторые 
другие команды. 

ФЛАЖОК ЕМ — ЭМУЛЯЦИЯ (БИТ Д} 

0 - нет эмуляции сопроцессора; 1 = эмулировать сопро¬ 
цессор. 

Для передачи управления сопроцессору обычно при¬ 
меняется команда ESC. Если при выполнении ESC фла¬ 
жок ЕМ " 1, генерируется особый случай прерывания, и 
обработчик прерываний эмулирует численный сопроцес¬ 
сор. 

ФЛАЖОК МР — НАЛИЧИЕ СОПРОЦЕССОРА ( 

0 - нет сопроцессора; 1 - сопроцессор присутствует. 

CPU 80386 проверяет этот флажок при выполнении 
команды WAIT. Если МР » 1, то проверяется флажок 
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TS; если TS также установлен, генерируется особый 
случай прерывания, активизирующий сопроцессор. 


ФЛАЖОК РЕ — РАЗРЕШЕНИЕ ЗАЩИТЫ (БИТ 0) 


0 - реальный режим; 1 - защищенный режим (включа¬ 
ет режим виртуального процессора 8086). 

Состояние этого флажка показывает режим работы 
процессора. Отметим, что режим виртуального 8086 яв¬ 
ляется подмножеством защищенного режима. 

Все 32 бита регистра CR1 зарезервированы фирмой 
Intel. Регистр CR2 применяется, если включена странич¬ 
ная организация; если возникает нарушение выборки 
страниц (обычно, если нужной страницы нет в памяти), 
то в нем сохраняется линейный адрес, вызвавший нару¬ 
шение. Старшие 20 бит регистра CR3 также применяют¬ 
ся для страничной организации; они содержат базовый 
адрес каталога страниц. Младшие 12 бит CR3 не опре¬ 
делены. 

Регистры отладки (см. рис. 2.7) являются важ¬ 
ным элементом мощных отладочных средств 80386. 
Сами регистры подробно рассмотрены далее. Флаж¬ 
ки R и Т в регистре EFlags также применяются при 
отладке. 

Четыре регистра адреса отладки DR0 — DR3 содер¬ 
жат адреса остановов. Адреса являются либо реальными 
адресами, либо индексами в таблице страниц в зависи¬ 
мости от того, разрешена страничная организация или 
нет. Так как различные задачи могут использовать раз¬ 
ные таблицы страниц, бит в регистре DR7 сообщает, 
применимы ли адреса в DR0—DR3 ко всем задачам или 
только к текущей задаче. Адреса являются фактически¬ 
ми адресами и применимы к текущей задаче, когда про¬ 
цессор работает в реальном режиме, так как страничная 
организация и мультизадачность при этом недопустимы. 
Следовательно, прикладные программы могут прямо ис¬ 
пользовать регистры отладки. 

В зависимости от состояний флажков в реги¬ 
стре DR7 четыре адреса в DR0—DR3 могут вызвать 
останов, когда происходит обращение к данным по 
этим адресам. 
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Рис. 2.7. Регистры отладки 


Регистры DR4 — DR5 зарезервированы фирмой Intel. 
Регистр состояния отладки DR6 содержит несколько спе¬ 
циальных флажков. Младшие биты ВЗ—ВО показывают, 
какой набор условий вызывает останов. Аналогично биты 
BD, BS и ВТ показывают условия в регистрах отладки: 
возник ли особый случай прерывания при покомандной 
работе и установлен ли бит Т, связанный с переключе¬ 
нием задачи. 

Регистр управления отладкой DR7 помогает вклю¬ 
чать или выключать отладочные средства. Поля 
LENO—LEN3 определяют длину элемента данных, конт¬ 
ролируемого по адресам из DRO—DR3. Биты R/W сооб¬ 
щают при каких условиях регистр адреса отладки вызо¬ 
вет останов (выполнение команды, запись данных или 
считывание/запись). Если значение в одном из четырех 
полей R/W = 0 (останов при выполнении команды), то 
соответствующее поле длины LEN должно содержать 0 
(длина не определена). 
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Четыре бита GO—G3 определяют для каждого реги¬ 
стра DR0 — DR3, доступен ли он глобально, т. е. досту¬ 
пен всем задачам. Биты LO — L3 определяют, доступен 
ли каждый из регистров адреса локально, т. е. доступен 
только текущей задаче. Биты LO—L3 изменяются при 
переключении на новую задачу, но они «перевешивают¬ 
ся» 1 в соответствующем бите GO — G3. 

Из-за конвейеризации процессор может вызвать ос¬ 
танов при опережающей выборке команды. Так как во 
внутреннем конвейере могут находиться несколько ко¬ 
манд, «подозрительной» может стать команда, которая 
не выполнялась. Если установлен байт LE или GE, то 
включается опережающая выборка; это* уменьшает ско¬ 
рость, но обеспечивает условия,, при которых останов 
вызывает только выполняемая команда. Флажок ЬЁ 
сбрасывается при переключении задачи, а флажок GE 
нет. 

Два проверочных регистра доступны нескольким ко¬ 
мандам MOV. Они допускают запись и считывание дан¬ 
ных из буфера преобразования, который применяется 
для ускорения работы со страницами. Регистры полезны 
при разработке тест-программ для аппаратных средств и 
даже для разработки процедур оптимизации страничной 
организации. Проверочные регистры почти не использу¬ 
ются прикладными и системными программистами. 


2.6.2. Регистры управления памятью 

Четыре регистра описывают структуры данных, ис¬ 
пользуемые операционной системой для управления па¬ 
мятью. Важно понимать, что 80386 может одновременно 
выполнять несколько задач, а каждая задача состоит из 
нескольких сегментов. У каждого сегмента есть дескрип¬ 
тор, содержащий размер сегмента и другую важную ин¬ 
формацию. Мультизадачность рассматривается в главе 5. 


IDTR — регистр дескрипторной таблицы прерываний, 
адресует таблицу точек входа обработки прерыва¬ 
ний. 

GDTR — регистр глобальной дескрипторной таблицы, 
содержит дескрипторы сегментов, доступных любой 
задаче, выполняющейся на компьютере. 
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LDTR — регистр локальной дескрипторной таблицы, со¬ 
держит дескрипторы сегментов, доступных конкрет¬ 
ной из текущих выполняющихся задач. 

TR — регистр задачи, содержит копию дескриптора те¬ 
кущей задачи и показывает, где сам дескриптор 
хранится в памяти. 


2.6.3. Типы данных 

Базовые типы данных процессора 80386: биты, бай¬ 
ты, 16-битные слова (в АХ, ВХ и других регистрах) и 
двойные слова (размер всех физических регистров ЕАХ, 
ESP и др.). Такие названия могут вызвать путаницу, 
так как «размер слова» компьютера обычно совпадает с 
размерами шины данных и/или внутренних регистров, а 
80386 — это 32-битный процессор. Однако 16-битное 
значение называется словом, чтобы обеспечить совмести¬ 
мость для всего семейства 8086. Другие типы данных 
образуются из базовых типов путем объединения их в 
большие единицы. 

При обращении к памяти процессор 80386 считыва¬ 
ет и записывает двойные слова, но отдельные байты 
можно модифицировать независимо от содержащего их 
двойного слова. Для программиста память состоит из по¬ 
следовательности байт, имеющих свои адреса. 

Ниже приведен список типов данных, которые под¬ 
держиваются процессором 80386. Большинство их знако¬ 
мо опытному программисту, но важно отчетливо пони¬ 
мать смысл всех терминов. 

Наименьшая единица — бит, принимающий значе¬ 
ние 0 или 1. При интерпретаций бит в регистре EFlags 
эти значения можно считать ложью (0) и истиной (1). 

Базовая единица — байт, он состоит из 8 бит и 
допускает несколько интерпретаций: 

1. Беззнаковое число от 0 до 255. Каждый бит от 

младшего (бит 0) до старшего (бит 7) пред¬ 
ставляет степень числа 2. Эти значения могут 
представлять также символы кода ASCII (бук¬ 
ва, цифра или специальный символ). 

2. Знаковое число от -128 до +127. Старший бит 

(бит 7) показывает знак числа (1 = отрица¬ 
тельное), а остальные — величину числа. Чис- 
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ла представляются в дополнительном коде (см. 
гл. 1). Набор 11111111 — это беззнаковое чис¬ 
ло 255, либо знаковое число -1. 

3. Десятичная цифра похожа на беззнаковое число, 
но диапазон ее от 0 до 9. Байт может содер¬ 
жать две десятичных цифры, занимающих по 4 
бита (тетраде). Команды процессоров семейства 
8086 поддерживают арифметику упакованных 
десятичных чисел. 

16-битное слово может содержать два байта, допу¬ 
скающих любой из приведенных выше форматов. Но 
как единая сущность слово допускает две интерпретации: 

1. 16-битное беззнаковое число от 0 до 65535. Все 

биты представляют степень числа 2; нумерация 
бит от 0 до 15. 

2. Знаковое число от -32768 до +32767. Бит 15 по¬ 

казывает знак (1 = отрицательное число). 

32-битное слово может содержать приведенные выше 
типы данных, но имеет и несколько других интерпрета¬ 
ций. 32-битные типы данных представляют собой макси¬ 
мальные числа и адреса, с которыми может работать 
процессор 80386. Есть две возможные интерпретации: 

1. 32-битное беззнаковое число от 0 до 2 32 -1 

(4 294 967 295). Такие числа называются 
близкими указателями, так как они могут ад¬ 
ресовать любую ячейку в данном сегменте. 

2. 32-битное знаковое число от 2 31 до 2 31 -1, где 

бит 31 показывает знак. 

Из базовых типов данных можно образовать другие 
типы: 

1. Двоичное поле состоит из смежных бит внутри 

двойного слова. Оно начинается в любом месте, 
но не выходит за пределы двойного слова. 
Максимальная длина поля от 1 до 32 бит в 
зависимости от начальной точки. Регистр 
EFlags образован из набора двоичных полей. 

2. Цепочка в общем смысле означает последователь¬ 

ность смежных бит, байт, слов или двойных 
слов. Двоичная цепочка может содержать до 
2 32 -1 бит, а другие цепочки до 2 3 М байт. 
Символьная цепочка состоит из байт, содержа¬ 
щих символы ASCII. 
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Сопроцессор 80387 поддерживает еще два типа дан¬ 
ных: 64-битное слово и 80-битное значение (tbyte). 


2.6.4. Режимы адресации 

Некоторые команды работают с данными, содержа¬ 
щимися в самой команде или в регистрах CPU, т. е. 
они не обращаются к памяти. Это примеры непосредст¬ 
венного и регистрового режима адресации, например, в 
команде MOV AX,7FH используются оба эти режима. 

Когда программа обращается к памяти, она должна 
сообщить компьютеру, какую ячейку памяти использо¬ 
вать. В простейшей форме можно прямо указывать имя 
ячейки, например, ADD AX.ANADDRESS, где 
AN ADDRESS — ранее определенная ячейка. 

Для эффективного программирования требуется ис¬ 
пользовать несколько способов именования ячеек памяти. 
В ассемблерном операторе для определения адреса мож¬ 
но объединять 4 возможных элемента. Вычисленный или 
«эффективный адрес» объединяется с соответствующим 
сегментным регистром, давая окончательный адрес. Вот 
эти элементы: 

1. База. Это содержимое одного из регистров обще¬ 

го назначения. База считается начальной точ¬ 
кой, а другие элементы прибавляются к ней с 
образованием эффективного адреса. В регистр 
можно поместить начальную ячейку массива 
данных. 

2. Смещение. Это адрес ячейки в сегменте памяти. 

Длина смещения 8, 16 или 32 бита. 

3. Индекс. Как и в базовой адресации, для образо¬ 

вания эффективного адреса используется содер¬ 
жимое какого-либо регистра. В случае 16-бит¬ 
ных операндов для индексирования предназна¬ 
чены SI и DI; а в случае 32-битных операн¬ 
дов — любой регистр, кроме ESP. 

4. Масштаб. Если индекс является 32-битной вели¬ 

чиной, его можно умножить на 2, 4 или 8. 
Это удобно при обращении к массивам с эле¬ 
ментами фиксированного размера. 

Эффективный адрес вычисляется следующим обра¬ 
зом: 

ЕА = База + (Индекс к Масштаб) + Смещение 
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При отсутствии некоторых элементов формула упро¬ 
щается. Если, например, нет индекса, то ЕА = База + 
Смещение. Ниже приведены примеры использования 
каждого режима. 

1. Прямая адресация включает регистровые и непос¬ 

редственные операнды; обращение к памяти не 
требуется. 

2. Используется только смещение. Смещение обычно 

указывается меткой; вычисляется расстояние от 
текущей команды до метки и используется ка 
смещение при обращении к памяти. 

3. В косвенной адресации адресом служит содержи¬ 

мое регистра; имя регистра заключается в 
квадратные скобки. Например, команда MOV 
АХ,ВХ передает в АХ содержимое ВХ, а ко¬ 
манда MOV АХ,[ВХ] передает в АХ содержи¬ 
мое ячейки памяти, адресуемой содержимым 
регистра ВХ. 

4. Базовая адресация требует прибавить константу к 

значению в регистре и использовать сумму как 
эффективный адрес. Выражение «регистр + сме¬ 
щение»* заключается в квадратные скобки. На¬ 
пример, в команде MOV АХ, [ВХ+4 ] сумма со¬ 
держимого ВХ и 4 служит эффективным адг '- 
сом. Значение, содержащееся по данному ад 
су, передается в АХ. 

В остальных режимах используется индексирование. 
Индекс заключается в квадратные скобки и помещается 
после базы, с которой он суммируется. Масштабировать 
(умножать на 2, 4 или 8) можно только индексы. 

5. В индексной адресации эффективный адрес равен 

сумме прямого адреса и индекса. В команде 
MOV ЕСХ, TABLE [SI ] эффективный адрес равен 
сумме SI и значения TABLE. Число, храня¬ 
щееся по эффективному адресу передается в 
ЕСХ. 

6. Индекс объединяет базу в регистре и индекс в 

регистре. В команде MOV ECX,[EDX][EAX] 
эффективный адрес равен сумме EDX и ЕАХ. 
В случае 32-битных операндов индекс можно 
масштабировать. 

7. Масштабированный индекс можно умножать на 2, 

4 или 8. Например, в команде ADD ЕСХ, 
TABLE [ESIx8] значение из ESI умножается 
на 8, суммируется с адресом TABLE и резуль- 



52 


Архитектура процессора 80386 


тат служит эффективным адресом. Такой прием 
особенно удобен для элементов данных длиной 
в 8 байт. 

Кроме приведенных режимов можно использовать 
любую комбинацию базы, индекса (с масштабированием 
или нет) и смещения. Вычисление адреса ведется парал¬ 
лельно с другими действиями, поэтому даже в случае 
самого сложного режима адресации дополнительное вре¬ 
мя не требуется. Но есть одно исключение: при наличии 
базы, индекса и смещения время увеличивается на один 
такт. 


2.6.5. Прерывания и их особые случаи 

Прерывание — это изменение обычного хода испол¬ 
нения программы. Обработка прерываний встроена в 
процессор 80386; при выполнении команды он прежде 
всего контролирует наличие прерывания. Прерывание 
(появившееся извне или вызванное исполнением коман¬ 
ды) инициирует обращение к таблице прерываний; таб¬ 
лица адресует процедуру, служащую «обработчиком пре¬ 
рывания». Процессор 80386 имеет три типа прерываний. 
Первый тип называется «особым случаем» и возникает 
при выполнении команд. Например, при выполнении ко¬ 
манды INT фактически возникает особый случай преры¬ 
вания. Обработка прерываний в операционных системах 
ведется по разному. Список особых случаев прерывания 
для реального режима приведен в табл. 2.1. 

Существует 4 типа особых случаев прерывания: 
аварии, специальные прерывания (traps), нарушения и 
программные особые случаи (называются еще программ¬ 
ными прерываниями). Авария — самый серьезный осо¬ 
бый случай, он не позволяет идентифицировать вызвав¬ 
шую команду и осуществить рестарт программы. Это 
возникает, если какой-либо элемент компьютера ведет 
себя неожиданным образом, поэтому проблемы связаны 
не только с текущей командой, но и с неверными пред¬ 
ыдущими результатами. Аварии часто вызываются аппа¬ 
ратными ошибками (не ошибками устройств ввода/вы¬ 
вода) и несовместимыми значениями в системных таб¬ 
лицах. 
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Таблица 2.1. Номера и описания прерываний 


Номер 

Описание 

Команда 

0 

Ошибка деления 

DIV, IDIV 

1 

Особый случай при отладке 

Любая 

2 

Немаскируемое прерывание 


3 

Останов 

INT 3 

4 

Переполнение 

INTO 

5 

Контроль границ массива 

BOUND 

6 

Неверный код операции 

Включая 

LOCK с 
неверной 
команды) 

7 

Сопроцессор отсутствует 

ESC, WAIT 

8 

Вектор прерывания слишком 
велик 

INT 

9 

Зарезервирован 


10 

Неверный TSS 

Переключение 

задачи 

11 

Сегмент отсутствует 

Многие 

12 

Пересечение границы стека 

PUSH, POP, 


(смещение меньше 0 или 

PU8HF, POPF, 


больше 64 Кбайт) 

PUSHA, POPA 

13 

Общая защита 
(смещение больше 64 Кбайт 
или длина команды 

более 15 байт) 

Многие 

14 

Страничное нарушение 
(страница отсутствует) 

Многие 

15 

Зарезервирован 


16 

Ошибка процессора 

ESC, WAIT 

17-31 

Зарезервированы 


32-255 

Доступны для маскируемых 
прерываний 



Специальное прерывание возникает сразу после вы¬ 
полнения ошибочной команды. Такое нарушение фикси¬ 
руется до или во время выполнения команды. 

Программное прерывание вызывается командой и 
возникает всегда или иногда. Примерами таких команд 
служат INT 3, INT n, BOUND. 
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Аппаратные прерывания подразделяются на два ти¬ 
па: маскируемые прерывания (исполняемые в зависимо¬ 
сти от состояния флажка I) и немаскируемые (выполня¬ 
ются всегда). Процессор 80386 проверяет наличие преры¬ 
вания перед выполнением каждой команды; немаскируе¬ 
мое прерывание вызывает программу обработчика преры¬ 
вания независимо от состояния программы. Немаскируе¬ 
мые прерывания подаются на вход INTR, а немаскиро¬ 
ванные на вход NMI (хотя эти прерывания фактически 
маскируются при обработке предыдущего немаскируемого 
прерывания). 

Немаскируемые прерывания имеют идентифика¬ 
тор 2, а маскируемые — от 32 до 255. Эти номера на¬ 
значаются внешним контроллером прерываний, напри¬ 
мер, 8259А. Каждый контроллер имеет 8 входов, причем 
на любой из них можно подключить еще один контрол¬ 
лер; это так называемое «каскадное» включение. Схемы 
контроллеров «прозрачны» для программистов, которые 
знают прерывания только по номерам. Система прерыва¬ 
ний в 80386 мало отличается от предыдущих типов про¬ 
цессоров. Но одно важное различие касается проблемы 
изменения флажка I в мультизадачной системе 
(см. гл. 5). 

Конкретные прерывания используются для разных 
функций, например, для обеспечения работы сопроцессо¬ 
ра и режима защиты. Далее прерывания рассматривают¬ 
ся только в связи с другими объектами. 



Глава 3 


СИСТЕМА КОМАНД 
ПРОЦЕССОРА 80386 


Глава 3 посвящается обзору системы команд про¬ 
цессора 80386 и преследует две цели. Первая — ввести 
читателя в семейство команд 8086, вторая — служить 
справочником системы команд процессора 8086. 

Команды сгруппированы по выполняемым функциям. 
Кратко описана каждая команда и общие правила ее 
применения. Большинство функциональных групп сопро¬ 
вождается примером действий одной или нескольких ко¬ 
манд данной группы. 

Очень важным для команд является понятие опе¬ 
ранда. Это то значение данных, которое «обрабатывает» 
команда. Хотя каждая команда имеет свою структуру 
операндов, но имеется и много общих особенностей. 

Операнд обычно рассматривается как источник или 
получатель (в зависимости от того, берет команда дан¬ 
ные или помещает данные в него). Получателями могут 
быть только регистры или ячейки памяти, а источника¬ 
ми — еще и непосредственные данные. Одновременно 
и источником, и получателем ячейки памяти быть не 
могут. 

Обычно операнды могут иметь любой размер (байт, 
слово или двойное слово). В большинстве команд с не¬ 
сколькими операндами все операнды имеют одинаковый 
размер. 

Полное описание каждой команды см. в главе 4. 
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3.1. КОМАНДЫ ПЕРЕДАЧИ ДАННЫХ 


Команды этой группы пересылают данные из одного 
места компьютера в другое: между регистрами, между 
регистрами и памятью, между регистром или памятью и 
стеком. 

MOV — пересылает один элемент данных из одного ме¬ 
ста в другое. 

XCHG — обменивает содержимое двух регистров или 
содержимое регистра и ячейки памяти. Часто при¬ 
меняется для синхронизации нескольких процессов, 
так как ее нельзя прерывать другим устройством, 
использующим шину данных. 

PUSH — копирует операнд-источник в вершину стека. 
Применяется для помещения параметров в стек пе¬ 
ред вызовом процедуры. Полезна также для времен¬ 
ного сохранения данных в стеке. 

POP — берет верхний элемент из стека и пересылает 
его в операнд-получатель. Применяется для возвра¬ 
щения из стека значений, включенных в него ко¬ 
мандой PUSH. 

PUSHA и PUSHAD — применяются для помещения со¬ 
держимого всех 8 регистров общего назначения в 
стек (PUSHA — оперирует 16-битными регистрами, 
PUSHAD — 32-битными регистрами). Эти команды 
используются перед вызовом процедур. 

РОРА и POPAD — восстанавливают из стека содержи¬ 
мое 8 регистров общего назначения, являясь допол¬ 
нением команд PUSHA и PUSHAD. 

Следующий пример показывает два способа обмена 
содержимого двух регистров. Отметим, что в варианте 1 
применяется стек, а не ячейка памяти. 


Исходное состояние: 


ЕАХ 00000117 


Евх 00002F3E 
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Вариант J: 

PUSH EAX 

MOV EAX.EBX 

POP EBX 

Вариант 2: 

XCHG EAX.EBX 

Состояние теле обмена: 


передать ЕАХ в стек 
передать содержимое ЕВХ в 
ЕАХ 

передать старое значение ЕАХ 
из стека в ЕВХ 


; обменять содержимое ЕАХ и 
; ЕВХ 


ЕАХ 00002F3E 


ЕВХ 00000117 


3.2. АРИФМЕТИЧЕСКИЕ КОМАНДЫ 

Эти команды применяются для выполнения арифме¬ 
тических операций над знаковыми или беззнаковыми 
числами. Они часто встречаются в программах. 

ADD — суммирует два операнда, помещая результат в 
первый операнд (получатель). 

SUB — вычитает один операнд (источник) из другого 
(получатель). Разность замещает место получателя. 
INC — увеличивает операнд на 1, не воздействуя на 
флажок переноса. Применяется в циклах для инкре¬ 
мента индекса. 

DEC — уменьшает операнд на 1, не воздействуя на 
флажок переноса. Применяется в циклах для декре¬ 
мента индекса. 

MUL — эта простая команда умножает беззнаковые це¬ 
лые числа. Она имеет один операнд-источник. Еще 
два операнда умножения подразумеваются размером 
операнда-источника. 
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IMUL — умножает знаковые целые числа. Это более 
гибкая и сложная команда. Она имеет 4 базовые 
формы по числу и типу операндов (один, два или 
три операнда). 

DIV — осуществляет деление целых беззнаковых чисел. 
В делении есть фактически 4 операнда: делимое, 
делитель, частное и остаток. Определяется только 
местоположение делителя. Все остальные операнды 
определяются неявно, в зависимости от размера де¬ 
лителя. 

IDIV — аналогична команде DIV, но работает со знако¬ 
выми числами. 

NEG — изменяет знак операнда, находящегося в регист¬ 
ре или памяти. 

СМР — аналогична команде SUB, но не сохраняет ре¬ 
зультат. Команда сравнивает два числа для последу¬ 
ющего условного перехода. 

ADC — действует как команда ADD, но прибавляет 
значение переноса к сумме. Удобна для арифметики 
повышенной точности. 

SBB — действует как команда SUB, но вычитает из 
разности значение переноса. Удобна для арифметики 
повышенной точности. 

Следующий пример показывает различие между ко¬ 
мандами ADD и ADC. 


Исходное состояние: 


ЕАХ 

FFFFFFFO 

MEMLOC 

000027DA 

EDX 

00002F3E 

MEMLOC+4 

00000117 


ADD 

ADD 


EAX.MEMLOC ; сложить первую пару - 
EDX.MEMLOC+4 ; сложить вторую пару 
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Состояние после операции: 


ЕАХ 

000027 СА 

MEMLOC 

000027DA 

EDX 

00003055 

MEMLOC+4 

00000117 


Вариант 2: 

ADD ЕАХ, MEMLOC ; сложить младшие числа 

ADC EDX,MEMLOC+4 ; сложить старшие числа 

Состояние после операции: 


ЕАХ 

000027СА 

MEMLOC 

000027DA 

EDX 

00003056 

MEMLOC+4 

00000117 


Следующий пример показывает различие в коман¬ 
дах умножения знаковых и беззнаковых чисел. 

Исходное состояние: 


AL 


84 


DL 


12 


Вариант 1: 

MUL AL.DL 

Состояние после операции: 


; 132x18-2376 


АХ 


0948 


Значение в АХ равно 948Н 


2376. 
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Вариант 2: 

IMUL AL,DL ; -124*18--2232 

Состояние после операции: 



Следующий пример показывает различие в коман¬ 
дах деления знаковых и беззнаковых чисел: 

Исходное состояние: 

АХ 
DL 

Вариант I: 

DIV AL.DL ; 1215/154-7, осталось 137 

Состояние после операции: 

АХ 
АН 
AL 

Регистр AL содержит частное, а регистр АН — остаток 89Н-137. 
Вариант 2: 

IDIV AL.DL ; 1215/(-102)--! 1, остаток 93 
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Состояние поем операции: 


АХ [ 5DF5 
АН 5D 

AL F5 

Регистр AL содержит F5H или -11, т. е. частное; в регистре АН 
находится остаток 5DH-93. 


3.3. КОМАНДЫ ПРЕОБРАЗОВАНИЯ 
ДАННЫХ 

Команды этой группы применяются для преобразо¬ 
вания типов данных. Большинство из них работает со 
знаковыми числами, а одна пригодна и для беззнаковых 
чисел. 

MOVSX — команда пересылки с расширением знака, 
передает операнд-источник в получатель, расширяя 
знаковый бит источника в старшую часть получате¬ 
ля. 

MOVZX — аналогична предыдущей команде, но старшая 
часть получателя устанавливается равной нулю. 

CBW — команда преобразования байта в слово, имеет 
источником регистр AL, а получателем регистр АН, 
и действует аналогично команде MOVSX. Знаковый 
бит AL расширяется в АН, преобразуя знаковый 
байт из AL в знаковое слово в АХ. 

CWDE — преобразует знаковое слово из АХ в знаковое 
двойное слово в ЕАХ, расширяя знаковый бит АХ в 
старшую половину ЕАХ. 

CWD — также преобразует знаковое слово в знаковое 
двойное слово, но результат, в отличие от команды 
CWDE, помещается в два регистра. Знаковый бит 
из АХ расширяется в регистр DX. 

CDQ — эта команда заполняет регистр EDX знаковым 
битом регистра ЕАХ. 

Действие команд этой группы поясняют следующие 
примеры: 
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Исходное состояние: 

ЕАХ FACEFFFP 
ЕВХ 5А5А5А5А 
ЕСХ АСАСАСАС 
EDX 12345678 

Команды: 

MOVSX EAX.MEMLOC ; передать с расширением знака 

MOVZX EBX,MEMLOC ; передать с нулевым расширением 

MOVSX ECX.MEMLOC2 ; передать с расширением знака 

MOVZX EDX.MEMLOC2 ; передать с нулевым расширением 

Состояние после операции: 




3.4. КОМАНДЫ ДЕСЯТИЧНОЙ 
АРИФМЕТИКИ 

Прямой поддержки десятичной арифметики 80386 не 
обеспечивает, но имеет команды десятичной коррекции, 
действующие с обычными арифметическими командами. 
Есть два типа команд десятичной коррекции: команды 
ASCII -коррекции работают с одной цифрой в байте, а 
команды десятичной коррекции — с двумя цифрами. 
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AAA, AAS, AAM, AAD — команды ASCII -коррекции 
для арифметических- операций. Три из них приме¬ 
няются после обычной арифметической команды, 
корректируя полученный результат: ААА — после 
сложения, AAS — после вычитания и ААМ — по¬ 
сле умножения. Команда AAD — коррекции деле¬ 
ния выполняется до операции и подготавливает опе¬ 
ранды к делению. 

DAA, DAS — команды десятичной коррекции для сло¬ 
жения и вычитания, применяются аналогично пред¬ 
ыдущим. 

Следующий пример показывает действие команды 
ААА. 


Исходное состояние: 


АХ 


0009 


Команды: 

ADD AL,8 ; 9+8-11Н(17) 

ААА ; коррекция 

Состояние после операции: 


АХ 


0107 


3.5. ЛОГИЧЕСКИЕ КОМАНДЫ 

Команды этой группы применяются для производст¬ 
ва булевых операций и обеспечивают работу с двоичны¬ 
ми полями в байтах, словах и двойных словах. 

AND — выполняет логическую функцию И для двух 
операндов и удобна для установки двоичного поля в 
нуль. 
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OR — выполняет логическую функцию ИЛИ для двух 
операндов. Обычно применяется для установки дво¬ 
ичного поля в нужное состояние (поле предвари¬ 
тельно очищается командой AND). 

NOT — инвертирует биты своего операнда. 

TEST — команда логического сравнения аналогична ко¬ 
манде AND, но результат не сохраняется. Применя¬ 
ется для проверки двоичного поля на нуль (или не 
нуль). 

XOR — выполняет логическую функцию ИСКЛЮЧАЮ¬ 
ЩЕГО ИЛИ для двух операндов. Применяется для 
инвертирования в двоичном поле только определен¬ 
ных бит. 

SETxx — эти команды применяются для сохранения 
результата некоторого сравнения. Значение «хх» 
определяет условие сравнения. Если сравнение 
истинно, то получатель устанавливается в 1; а 
если сравнение ложно, получатель устанавливается 
на 0. 

Следующий пример показывает действие четырех 
основных логических команд с идентичными операндами. 
Вы можете для контроля преобразовать 16-ричные числа 
в двоичные. Пример позволяет лучше разобраться в опе¬ 
рациях. 


Исходное состояние: 


АХ 


MEMLOC1 

MEMLOC2 

MEMLOC3 


сзсз 


сзсз 


сзсз 


AND MEMLOC1 ,АХ 

OR MEMLOC2.AX 

XOR MEMLOC3.AX 

NOT AX 
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Состояние после операции: 


АХ 


5555 


MEML0C1 

MEML0C2 

MEML0C3 


8282 

ЕВЕВ 

6969 


3.6. КОМАНДЫ СДВИГА 
И ЦИКЛИЧЕСКОГО СДВИГА 

Эти команды позволяют передвигать биты внутри 
любого из стандартных типов данных. Они применяются 
для ускорения операций умножения и деления целых 
чисел и для образования двоичных полей. 

SHR, SHL — команды логических сдвигов «вдвигают» 
нули с одного конца операндов, а биты с другого 
конца «выдвигаются». 

SAR, SAL — команды арифметического сдвига. Арифме¬ 
тический сдвиг влево аналогичен логическому сдви¬ 
гу, а при арифметическом сдвиге вправо происходит 
копирование знакового бита. Это удобно для деле¬ 
ния знаковых чисел на степени числа 2. 

ROR, ROL — при циклическом сдвиге биты данных не 
теряются: выдвигаемый бит помещается на место 
освобождающегося (вдвигаемого). 

RCL, RCR — это команды циклического сдвига, вклю¬ 
чающего перенос. Выдвигаемый бит операнда поме¬ 
щается во флажок переноса, а старое значение 
флажка переноса передается в освобождающийся 
бит. Обычно применяются в операциях повышенной 
(кратной) точности. 

SHRD, SHLD — это команды сдвигов двойной точности, 
но их действие отличается от команд циклического 
сдвига, включающих перенос. Эти команды имеют 
три операнда: источник, получатель и счетчик сдви¬ 
гов. Получатель сдвигается, и выдвигаемые биты те¬ 
ряются, а освобождающиеся биты заполняются бита¬ 
ми из источника. Сам источник не изменяется. 

3 Зак. 2046 
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Следующий пример показывает различие между 
обычным циклическим сдвигом и циклическим сдвигом, 
исключающим перенос. 

Исходное состояние: 


АХ 


FLAGS 


6699 

0202 


Вариант 1: 

ROR 


АХ,1 ; устанавливает 

; переполнение, перенос 
; не изменяется 


Состояние после операции: 


АХ 


FLAGS 


В34С 

0А02 


Вариант 2: 
RCR 


АХ,1 ; сбрасывает 

; переполнение, 

; устанавливает перенос 


Состояние после операции: 


АХ 


FLAGS 


3 34С 
0А03 
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3.7. КОМАНДЫ ОПЕРАЦИЙ 
НАД БИТАМИ 

Команды этой группы очень удобны для манипуля¬ 
ций отдельными битами, допуская их установку и про¬ 
верку. 

ВТ, BTS, BTR, ВТС. Команда проверки бита ВТ просто 
помещает значение указанного бита во флажок пе¬ 
реноса. Три другие команды выполняют эту же 
функцию, но позволяют адресуемый бит установить 
в 1 (BTS), сбросить в О (BTR) или инвертировать 
(ВТС). 

BSF, BSR — две команды сканирования бита: BSF (впе¬ 
ред) и BSR (назад) — находят первую 1 в операн¬ 
де, начиная с младшего бита (BSF) или старшего 
бита (BSR). Обе команды удобны при работе с дво¬ 
ичными образами. Команда BSR применяется также 
при вычислении двоичных логарифмов. 

Следующий пример показывает действие команд 
BSR, ВТС и BSR (число 22 в команде ВТС десяти¬ 
чное) . 

Исходное состояние: 


Команды: 

BSR 


ЕАХ 

ЕВХ 

ЕСХ 

FLAGS 


004037BF 


00000000 


ЕВХ,ЕАХ 
ЕАХ,22 
ЕСХ.ЕАХ 


; ЕВХ-номер бита 
; старшей 1 
; инвертировать 
; бит 22 

; ЕВХ-номер бита 
; старшей 1 


ВТС 
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Состояние после операции: 


ЕАХ 

ЕВХ 

ЕСХ 

FLAGS 



3.8. КОМАНДЫ УПРАВЛЕНИЯ 
ФЛАЖКАМИ 

Команды этой группы позволяют проверять и изме¬ 
нять флажки процессора 80386. Одни команды работают 
с отдельными флажками, другие — со всеми одновре¬ 
менно. 

На отдельные флажки воздействуют 7 команд. Ко¬ 
манды CLD и STD сбрасывают и устанавливают флажок 
направления. Команды CLI и STI сбрасывают и уста¬ 
навливают флажок направления. Команды CLC и СТС 
сбрасывают и устанавливают флажок переноса, а коман¬ 
да СМС инвертирует его. 

Команда LAHF загружает младший байт флажков в 
регистр АН. Команда SAHF производит обратную пере¬ 
дачу. Команды PUSHF и PUSFD включают регистры 
Flags и EFlags в стек. Соответствующие операции извле¬ 
чения из стека реализуют команды POPF и FOPFD. 

Следующий пример показывает действие некоторых 
команд управления флажками. 

Исходное состояние: 


ЕАХ 000037BF 


FLAGS 


0А93 
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Команды 


PUSHF 

SUB ЕАХ.ЕАХ 

POPF 

STD 


сохранить флажки 

OF,*SF, AF, CF-0; 
ZF, PF-1 
вернуть старые 
флажки из стека 
установить флажок 
направления 


Состояние после операций: 


ЕАХ 

1000000001 

FLAGS 

А 

0Е93 


3.9. ЦИКЛИЧЕСКИЕ КОМАНДЫ 

Часто приходится обрабатывать большие блоки дан¬ 
ных, и в этом помогают команды данной группы. Одна 
циклическая команда может реализовать цикл, требую¬ 
щий обычно нескольких команд. 

Каждая из этих команд обычно выполняет одну 
операцию пересылки, сравнения, загрузки, запоминания 
или сканирования. Для адресации источника применяет¬ 
ся регистр (E)SI, а получателя — регистр (T)DI. После 
команды оба регистра модифицируются для адресации 
следующего элемента цикла. Данные команды наиболее 
полезны при использовании с одним из префиксов по¬ 
вторения. 

REP, REPE, REPZ, REPNE, REPNZ — префиксы повто¬ 
рения, обеспечивают выполнение следующей за ни¬ 
ми команды заданное число раз. Префикс повторе¬ 
ния REP вызывает выполнение команды столько 
раз, сколько определено содержимым регистра ЕСХ. 
Аналогичные префиксы REPE и REPZ вызывают 
повторение команды либо до исчерпания счетчика, 
либо до установки флажка Z в нуль. Префиксы 
REPNE и REPNZ действуют аналогично REPE, но 
выход происходит при установке флажка Z в 1. 
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MOVS — эта команда просто пересылает фрагмент дан¬ 
ных из одной области памяти в другую. Необходи¬ 
мо тщательно проанализировать возможность пере¬ 
крытия фрагментов и соответственно определить со¬ 
стояние флажка направления. 

CMPS — сравнивает два фрагмента (массива данных). 
Для окончания сравнения в нужной точке применя¬ 
ются префиксы REPE или REPNE. 

STOS — полезна для заполнения фрагмента константой. 
Она передает содержимое соответствующей, части 
регистра ЕАХ в каждый элемент фрагмента. 

SCAS — сравнивает каждый элемент данных с частью 
регистра ЕАХ. Обычно с этой командой применяет¬ 
ся префикс REPE или REPNE. 

LODS — эта команда необычна в том, что она беспо¬ 
лезна с префиксом повторения. Она просто загружа¬ 
ет следующий элемент данных в некоторую часть 
ЕАХ. 

Следующий пример показывает общие принципы 

группы циклических команд. 

Предположения: 


STRING 1 имеет смещение 100Н в сегменте 151Н. 
STRING2 имеет смещение 105Н в сегменте 151Р. 
Флажок D содержит нуль (вперед). 


Состояние до операции: 


ESI 

00000200 

EDI 

00000300 

DS 


0151 

ES 


one 


A1 

A2 

A3 

A4 

A5 

FF 

FF 

FF 

FF 

FF 


Команды: 

адрес источника 
адрес получателя 
счетчик 

переслать массив байт 


LEA DI.STRING2 

MOV ЕСХ.5 

REP MOVSB 
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Состояние после операции: 


ESI 

00000105 

EDI 

0000010A 

DS 


0151 

ES 


0151 


A1 

A2 


A4 

A5 

A1 

A2 

A3 

A4 

A5 


3.10. КОМАНДЫ УПРАВЛЕНИЯ 
ПРОГРАММОЙ 

При создании программ часто приходится изменять 
последовательный ход исполнения команд. Команды дан¬ 
ной группы обеспечивают необходимые средства управле¬ 
ния ходом выполнения программы. 

JMP — команда безусловного перехода. Обычно в ней 
указывается метка, определяющая следующую вы¬ 
полняемую команду. Ассемблер формирует нужную 
форму JMP, зная местонахождение именованного 
(отмеченного) оператора. 

Jxx — команда условного перехода, в которой хх озна¬ 
чает код проверяемого условия (см. гл. 4). Обычно 
перед ней находится команда сравнения или другая 
команда, которая устанавливает некоторые флажки. 
CALL — команда вызова. Применяется для реализации 
процедур (называемых еще подпрограммами и фун¬ 
кциями). Команда вызова передает управление так 
же, как команда JMP. Однако до ее выполнения в 
стек включается необходимая информация, чтобы 
вызванная процедура могла возвратить управление 
команде, находящейся после команды CALL. Для 
выполнения возврата управления применяется ко¬ 
манда RET. 

LOOP, LOOPE, LOOPZ, LOOPNE, LOOPNZ — команды 
зацикливания. Помогают в реализации программных 
циклов. Команда LOOP повторяет цикл такое число 
раз, которое определяется содержимым регистра 
ЕСХ. В командах LOOPE и LOOPZ имеется допол- 
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нителыюе ограничение: цикл заканчивается, когда 
флажок Z будет нулевым. Команды LOOPNE и 
LOOPNZ аналогичны предыдущим, но цикл закан¬ 
чивается, когда флажок Z будет содержать 1. 

INT, INTO, IRET, IRETD — последняя группа команд 
передачи управления. Связана с прерыванием (под¬ 
робнее см. гл. 5). Команда INT инициирует выпол¬ 
нение системной процедуры. Команда INTO вызыва¬ 
ет процедуру прерывания 4, если установлен фла¬ 
жок переполнения. Обычно процедуры обработки 
прерываний входят в операционную систему. Воз¬ 
врат в вызывающую программу осуществляет одна 
из команд возврата из прерывания IRET или 
IRETD. 


Пример использования команд управления содержит 
фрагмент на языке высокого уровня и ассемблерный 
код. В примере осуществляется суммирование нечетных 
чисел от 1 до 10. 

Код на языке высокого уровня: 

SUM-0; 

DO INDEX-1 ТО 10; 

IF (INDEX AND 1)-1 THEN SUM-SUM+INDEX; 

END; 


Ассемблерный код: 


MOV BX,0 
MOV AX,1 

MOV ECX.10 
LOOP_START: 

TEST AX,1 
JZ SKIPIT 

ADD BX.AX 

SKIPJT: 

INC AX 

LOOP LOOP_START 

MOV SUM.BX 


; установить SUM-0 
; начальное значение 
; INDEX 

; счетчик повторения 

; проверить младший бит 
; перейти, если число 
; четное 

; прибавить, если 
; нечетное 

; инкремент числа 
; зацикливание 
; сохранить результат 
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3.11. КОМАНДЫ ПОДДЕРЖКИ ЯЗЫКА 
ВЫСОКОГО УРОВНЯ 

Обычно команды этой группы генерируются компи¬ 
ляторами, а программисты на ассемблере их не приме¬ 
няют. Такие команды упрощают разработку компилято¬ 
ров и обеспечивают аппаратную поддержку некоторых 
общих операций. 

BOUND — применяется для контроля границ массива. 
Операндами служат значение, нижняя граница и 
верхняя граница. Если значение не находится внут¬ 
ри границ, возникает прерывание. 

ENTER, LEAVE — парные команды, 'которые сокращают 
подготовительное время в начале процедуры. Коман¬ 
да ENTER организует стек в начале исполнения 
процедуры для упрощения доступа к аргументам и 
к переменным во взаимосвязанных процедурах. Ко¬ 
манда LEAVE восстанавливает стек, подготавливая 
возврат управления. 


3.12. КОМАНДЫ УПРАВЛЕНИЯ 
ПРОЦЕССОРОМ 

Команды данной группы управляют действиями 
CPU. Обычно они применяются для упрощения интер¬ 
фейса с другими процессорами в системе, например, с 
80287. 

ESC — префикс ESC информирует о том, что следую¬ 
щая команда предназначена для сопроцессора. 

WAIT — заставляет CPU остановить выполнение команд 
до получения сигнала BUSY. Применяется при ожи¬ 
дании результата от сопроцессора. 

LOCK — префикс блокировки. Резервирует системную 
шину за процессором 80386 на время выполнения 
следующей команды. Применяется для устранения 
конфликтов на шине в мультипроцессорных систе¬ 
мах. Примечание: префикс LOCK в 80386 имеет не¬ 
сколько ограничений (см. гл. 4). 

NOP — пустая команда; иногда применяется при отлад¬ 
ке. 

HLT — блокирует работу процессора до получения сиг¬ 
нала сброса. Применяется редко. 
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3.13. КОМАНДЫ ОПЕРАЦИЙ С 
АДРЕСАМИ 

Команды этой группы применяются для загрузки 
указателей. Имеются два типа команд. К первому типу 
относится одна команда LEA, которая загружает в ре¬ 
гистр смещение указанной ячейки памяти. Она удобна 
для загрузки индексного регистра. Ко второму типу от¬ 
носятся команды загрузки полного указателя: они загру¬ 
жают сегментный регистр и индексный регистр. В сег¬ 
ментный регистр загружается селектор сегмента ячейки 
памяти, а в индексный регистр — смещение ячейки па¬ 
мяти. Мнемоника команд имеет вид Lxx, где хх есть 
имя одного из сегментных регистров. 


Исходное состояние: 


EDI 

1000002001 

ES 


one 


Вариант 1: 

MOV ES.MEMLOC 
LEA EDI.MEMLOC 

Вариант 2: 

LES EDI.MEMLOC 


загрузить селектор 
в ES 

загрузить смещение 
в EDI 


загрузить селектор 
в ES, смещение в 
EDI 


Состояние после операции (оба варианта): 


EDI 

oooooioo| 

ES 


0242 





Система команд процессора 80386 


75 


3.14. КОМАНДА ПРЕОБРАЗОВАНИЯ 

Команда преобразования XLAT выделена в отдель¬ 
ную группу. Она осуществляет табличное преобразова¬ 
ние. Предполагается, что AL содержит байтный индекс 
таблицы, адресуемой регистром (Е)ВХ. Байт в AL заме¬ 
няется элементом таблицы. Команда применяется для 
преобразования символьного кода и синтаксического раз¬ 
бора команд. 


ЗАКЛЮЧЕНИЕ 

В этой главе дан краткий обзор команд 80386. Она 
может служить справочником, когда вы знаете, что вам 
нужно сделать, но не уверены в правильности выбора 
команды. Теперь вы готовы к восприятию материала 
главы 4, где приведены более подробные сведения о 
каждой команде. 



Глава 4 


ИНСТРУКЦИИ 
ПРОЦЕССОРА 80386 


Выше дан общий подход к некоторым техническим 
вопросам. В процессоре 80386 реализованы наиболее пе¬ 
редовые идеи вычислительной техники, но ради совме¬ 
стимости с его предшественниками он учитывает и «ис¬ 
торию» микропроцессоров. Программирование процессора 
80386 требует обширных знаний, часть которых изложе¬ 
на в предыдущих главах. На основе этих знаний про¬ 
граммист действует как архитектор, разрабатывая про¬ 
грамму, которая удовлетворяет интересам пользователей 
и максимально использует аппаратные ресурсы. 

Значительное время уходит на «шлифовку» задачи 
после окончания разработки программы: передать данные 
в CPU, сдвинуть, умножить или сложить их, а затем 
сохранить или распечатать. Здесь на помощь приходит 
система команд. Знание того, когда пользоваться «моло¬ 
точком» (например, командой сдвига) или «кувалдой» 
(командой умножения), сильно влияет на конечный про¬ 
дукт. 

Система команд максимально приближает нас к 
процессору. Знать, какое время требуется для выполне¬ 
ния команды, и иметь общее представления о размерах 
команды необходимо для опытного программиста на ас¬ 
семблере. Конечно, часто достаточно написать на ассемб¬ 
лере только критичные фрагменты программы и для 
этого нужно знать только подмножество команд. Но же¬ 
лающим разрабатывать средние и большие ассемблерные 
программы нужно внимательно изучить материал данной 
главы. Он поможет Вам эффективнее работать. 

Эффективность опирается на знание скорости вы¬ 
полнения каждого фрагмента программы. Предположим, 
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CLC CMP DEC ENTER IDIV MOV MUL 



Рис. 4.1. Время выполнения некоторых команд 

что вы преобразуете программу для процессора 80386 и 
хотите по возможности оптимизировать ее. Пусть в про¬ 
грамме число умножается на 10 путем сдвига числа на 
три бита влево и прибавления два раза исходного числа. 
На это требуется 14 тактов, что эффективнее команды 
MUL (70 и более тактов), при условии, что все числа в 
регистрах. Однако в процессоре 80386 вместо 14 тактов 
требуется 9, а команда IMUL длится всего 10 тактов. В 
этом случае использование одной команды IMUL пред¬ 
почтительнее (простота и ясность). 

На рис. 4.1 показано, что система команд 80386 по 
времени выглядит «плоской», т. е. различие во времени 
выполнения команд не столь велико, как у процессора 
8088. Из рисунка видно также, что быстродействие про¬ 
цессора 80386 гораздо выше, чем у 8088. В 80386 ко¬ 
манда IDIV длится дольше команды СМР только в 6 
раз, а в 8088 — в 19 раз. В старых процессорах было 
выгодно заменять медленную команду на несколько бо¬ 
лее быстрых (например, три сложения вместо умноже¬ 
ния на 3). На все эти приемы уходит время, и получа¬ 
ется запутанная программа. Однако в 80386 такие при¬ 
емы не требуются, он позволяет применять логически 
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наиболее подходящую команду и пользоваться всей сис¬ 
темой команд, а не только самыми быстрыми коман¬ 
дами. 

Знать материал данной главы необходимо и для на¬ 
писания более компактных программ. Хорошие ассемб¬ 
лерные программы компактны по двум причинам. Они 
опираются на самые подходящие команды с учетом вре¬ 
мени их выполнения. Учитывается также и фактический 
размер команды. Команда сложения содержимого двух 
регистров меньше команды прибавления к регистру 
непосредственного значения, так как оно входит в 
команду. 

Материал этой главы позволит проверить критиче¬ 
ские по времени или размеру фрагменты программы. 
Такую информацию целесообразно давать в документа¬ 
ции. 


4.1. КАК РАБОТАЕТ ЯЗЫК АССЕМБЛЕР 

Язык ассемблер — это не низший уровень програм¬ 
мирования, так как ассемблер транслирует команды в 
рассматриваемые ниже «форматы». Например, команда 
POP А преобразуется в байт 61Н. Другие команды длин¬ 
нее из-за указания ячеек памяти или регистров. 

Ассемблированные команды образуют «объектный 
код», называемый «машинным языком». Зная материал 
данной главы, вы можете точно узнать, какой машин¬ 
ный код образует конкретная программа, но он менее 
эффективен, чем ассемблированный код. 

Язык ассемблера первых микропроцессоров был 
очень простым. Например, микропроцессор 6502 имеет 
всего два общих регистра. Команды были очень специа¬ 
лизированы, например, TXY (передать в регистр Y со¬ 
держимое регистра X), и каждая имела один машинный 
эквивалент (или несколько в зависимости от режима ад¬ 
ресации). Однако, в процессоре 80386 много регистров и 
режимов адресации. Для передачи из одного регистра в 
другой (или в память, или из памяти в регистр) приме¬ 
няется команда MOV с последующим указанием нужных 
регистров. Следовательно, команда MOV имеет много 
машинных представлений в зависимости от типа переда¬ 
чи и режимов адресации. Ее различные варианты имеют 
разные форматы и длины. В языке ассемблер, в отличие 
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от языка высокого уровня, каждая команда транслирует¬ 
ся в одну машинную команду. 

Как же «воплотить» язык ассемблер в процессоре? 
Секрет в «микрокоде», имеющемся в большинстве совре¬ 
менных процессоров. Микрокод — это «программа», вы¬ 
полняющаяся в интегральных схемах, которая дешифри¬ 
рует объектный код и реализует нужные функции. Сле¬ 
довательно, микрокод — это средство разработчиков 
схем процессора, позволяющее упростить интегральную 
схему и организовать ее модули. 


4.2. ЧТО ТАКОЕ ФОРМАТ КОМАНДЫ? 

Формат команды — это просто ее двоичное пред¬ 
ставление. Обычно при программировании на ассемблере 
не обязательно знание форматов. Однако при расшиф¬ 
ровке 16-ричных распечаток требуется знание форматов 
команд; оно необходимо и при внесении в программу 
«заплат». 

Большинство команд 80386 имеет несколько форма¬ 
тов. Для процессора операции с числами из памяти на¬ 
много сложнее, чем использование содержимого двух ре¬ 
гистров. Например, схема опережающей выборки попы¬ 
тается «украсть» циклы шины для считывания операнда 
во время выполнения другой команды, что повлияет на 
эффективность опережающей выборки. Ассемблеры для 
80386 позволяют программисту не касаться внутренних 
операций процессора. Для лучшего понимания форматов 
команд рассмотрим элементы машинного языка. 

Первой располагается сама команда, часто называе¬ 
мая кодом операции КОП. Код сообщает компьютеру, 
что нужно делать: переслать информацию, сложить два 
числа, осуществить переход. Иногда для выполнения ко¬ 
манды достаточно одного кода операции. Например, ко¬ 
манда установки бита переноса STC требует только кода 
операции, так как ее действие подразумевается самой 
командой. Формат команды очень простой 0F9H. Она 
выполняется всего за два такта синхронизации. 

Но кроме КОП компьютеру нужно знать, где нахо¬ 
дятся операнды команды. Для кодирования этой инфор¬ 
мации в процессоре 80386 применяются два способа. 

В некоторых командах операнд-регистр определяется 
битами в коде операции. Команда PUSH имеет один 
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операнд. Если в стек включается содержимое регистра, 
то номер регистра находится в коде операции: 50Н 
включает в стек АХ, а 51Н — регистр СХ. Номер бита 
содержится в одном байте и выполняется за два такта. 
Это более простой способ. 

В командах с несколькими операндами или с опе¬ 
рандом в памяти местоположение операнда определяется 
сложнее. В них после байта кода операции имеется еще 
один байт ModRM (см. рис. 4.1а). 


7 6 5 4 3 2 1 0 


mod 


reg 


r/m 


Рис. 4.1,а. Байт ModRM 

Три поля в байте ModRM играют свою роль в оп¬ 
ределении операндов команды. 

Поле r/m в трех младших битах показывает либо 
один из 8 регистров общего назначения, либо один из 
24 режимов адресации в зависимости от содержимого 
поля mod. 

Поле reg в командах с двумя операндами определя¬ 
ет номер регистра. В однооперандных командах это поле 
действует как расширение кода операции, уточняя смысл 
команды. 

Из четырех значений в поле mod одно показывает, 
что поле r/m содержит номе{і регистра. Три значения 
выбирают одну из трех групп восьми режимов адреса¬ 
ции. 

Вернемся к команде PUSH. Если в стек включается 
число из RAM, нужно сообщить компьютеру, где его 
найти. Команда принимает вид OFFH mod 6 r/m. Сама 
команда занимает первый байт и три бита в середине 
второго байта (ПО). Биты «mod г/щ» сообщают режим 
адресации, т. е. откуда взять число. Так определяется 
адрес RAM. С учетом этих действий неудивительно, что 
команда выполняется всего за 5 тактов. (В 8088 требу¬ 
ется более 16 тактов). 

Некоторые режимы адресации требуют больше ин¬ 
формации для локализации операнда. В этом случае об 
этом сообщает байт ModRM, а за ним находится еще 
один байт SIB (Scale — масштаб, Index — индекс, 
Base — база), см. формат на рис. 4.16. 
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Масштаб Индекс 


База 


Рис. 4.1,6. Байт SIB 


Как и в байте ModRM, три поля определяют раз¬ 
личные элементы информации о режиме адресации. 

Поле «база» в трех младших битах определяет ре¬ 
гистр, который используется как базовый регистр. 

Поле «индекс» из трех бит определяет индексный 
регистр. 

Поле «масштаб» в старших двух битах задает мас¬ 
штабный множитель для индексной адресации. 

По форматам команд 80386 опытный программист 
может узнать многое. Например, новые команды провер¬ 
ки бита ВТ вроде бы должны быть максимально корот¬ 
кими. Эти команды применяются часто и выполняют 
очевидные функции. Однако, все эти команды начина¬ 
ются с байта 0FH и требуют байт для определения ко¬ 
манды и еще байты для адреса и непосредственных дан¬ 
ных. В этом случае лишний байт увеличивает время 
выполнения команды на один такт. 

Указания по расшифровке информации о формате 
команд даны перед рассмотрением самих команд. 

4.3. ВРЕМЕННАЯ ИНФОРМАЦИЯ 

Информация о времени выполнения команд варьи¬ 
руется от точной до неопределенной. Конечно, команды 
типа CLC (сбросить флажок переноса) всегда выполня¬ 
ются за одно и то же время (2 такта). Время выполне¬ 
ния команд с операндами в регистре или памяти значи¬ 
тельно изменяется. По существу, одна такая команда 
фактически представляет несколько команд, в зависимо¬ 
сти от местонахождения операндов. Понятие одной ко¬ 
манды удобно для программиста, но оно уводит нас от 
реализации операций внутри процессора. Попытка вы¬ 
числить время выполнения команды связана со значи¬ 
тельными усилиями. Далее дается подробная информа¬ 
ция о каждой команде. 
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Очередь Очередь Операционное 

опережающей команд устройство 

выборки 

Обычная работа: операционное устройство использует очереди 



Очередь Очередь Операционное 

опережающей команд устройство 

выборки 

5 % времени: операционное устройство опережает очереди 
Рис. 4.2. Очереди и скорость выполнения 

Временная информация оказывается неточной: боль¬ 
шинство программ выполняется примерно на 5% дольше. 
Причина этого скрыта в особенностях схемы процессора 
80386. 

Приводимые ниже времена предполагают, что кон¬ 
вейер всегда действует. Конвейеризация — это возмож¬ 
ность одновременно выбирать одну команду, дешифриро¬ 
вать вторую и исполнять третью. Для этого введены 
очереди: они содержат несколько выбранных команд, 
ожидающих дешифрирования, и несколько дешифриро¬ 
ванных команд, ожидающих исполнения. Фактически же 
некоторые команды исполняются быстрее, чем выбирают¬ 
ся и дешифрируются. Если несколько таких команд идут 
подряд, очереди медленно освобождаются, когда команд¬ 
ное устройство проходит через простой код. Когда оче¬ 
реди пустые, командное устройство должно ожидать ми¬ 
нимальное время от части времени выборки и дешифри¬ 
рования до выполнения своих операций. В этом случае 
быстродействие процессора 80386 уменьшается (см. рис. 
4.2). Любая команда передачи управления (JMP, CALL, 
RET и др.) также освобождает очереди, так как устрой¬ 
ство выборки не знает, откуда считывать следующую 
команду. 

В результате этого приводимые далее времена не 
являются точными (и это не «сбои» в процессоре 80386, 
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а отход от конвейерной работы). Если очередь команд 
пуста, когда операционное устройство готово, следующая 
команда выполняется дольше, чем обычно. Потеря вре¬ 
мени зависит от того, когда дешифрированная команда 
попадет в очередь. В среднем нарушения работы конвей¬ 
ера увеличивают время выполнения программы примерно 
на 5 %. При наличии кэш-памяти увеличение будет 
меньше, так как выборка происходит быстрее, чем 
обычно. Конечно, понятия «средней» программы нет, по¬ 
этому для каждой конкретной программы будет свое 
увеличение времени выполнения. 

Знание точного времени выполнения программы 
вряд ли потребуется. «Средний» программист может про¬ 
сто добавить 5 % к вычисленному времени. Почти ни¬ 
когда не следует пытаться уменьшить эти потери, пере¬ 
упорядочивая команды. 

Кроме того, ща расчет времени выполнения про¬ 
грамм сказывается различие в быстродействии между ре¬ 
альными и защищенными режимами. Программист при 
разработке программы может не знать, в каком режиме 
она будет выполняться, а от этого зависит время выпол¬ 
нения некоторых команд. Примерами служат команды 
загрузки указателей (LDS, LES, LFS, LGS и LSS) и 
межсегментные передачи управления JMP, CALL и RET 
(условные переходы вида JNE не пересекают границ 
сегментов). 


4.4. 80386 И ДРУГИЕ 
ПРОЦЕССОРЫ ІАРХ 86 

Необходимо знать, какие команды на каких микро¬ 
процессорах работают, чтобы обеспечить транспортабель¬ 
ность программ. 

В обзоре команд в скобках показано, в каком про¬ 
цессоре впервые появилась каждая команда. Система ко¬ 
манд каждого нового процессора является надмножеством 
системы команд предыдущего, что обеспечивает совме¬ 
стимость вверх. Иногда процессоры совместимы по языку 
ассемблера, но не по объектному коду. В этом случае 
придется заново ассемблировать программу; правда, по¬ 
лучить копию исходного кода не так просто. 

В каждом процессоре появились новые команды. 
Примерно 90% команд 80386 неизменны и совместимы с 
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Система команд защищенного режима 
Защищенный режим 80386 


Система команд защищенного режима 
Защищенный режим 80286 


Расширенная система команд 
80188/88 


Базовая система команд 
8086/88 


Рис. 4.3. Системы команд семейства ІАРХ 86 


8086/8088 (с учетом возможности работы с 32-битными 
операндами). Из 10% часть команд допускают новые 
режимы адресации и средства защиты, а некоторые ко¬ 
манды совершенно новые. 

На рис. 4.3 показаны взаимосвязи между системой 
команд процессора 80386. Большинство команд совмести¬ 
мы с 8086/8088. В процессоры 80186/188 введено не¬ 
сколько новых команд и повышено их быстродействие. 

В процессоре 80286 нет новых обычных команд, но 
введены команды управления памятью и защиты про¬ 
грамм. Эти команды редко используются прикладными 
программистами. Однако ограничение адресного про¬ 
странства 640 Кбайтами (MS-DOS накладывает на IBM 
PC) до появления машин с 386-м процессором не было 
преодолено. 

В процессор 80386 введено много новых обычных 
команд, особенно для операций с отдельными битами. 
Он имеет 32-битные тракты данных, но допускает обра¬ 
ботку байт и слов. Эти команды действуют в реальном 
режиме. 

Защищенный режим 80386 предлагает обширный на¬ 
бор команд управления памятью, защиты, организации 
виртуальной памяти и отладки. 
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4.5. СИСТЕМА КОМАНД 

Далее дается подробная информация о всех коман¬ 
дах 80386. Команды упорядочены по алфавиту, что уп¬ 
рощает поиск нужной команды. 

Нужно внимательно изучить вводную информацию 
о форматах команд. Она необходима для понимания ис¬ 
пользуемых сокращений. 

В табл. 4.1 показан список логических функций. 
Некоторые команды прямо реализуют эти функции, а 
многие опираются на них в своем описании. 

Таблица 4.1. Логические операции над тетрадами 


р 

Q 

Р and Q 

Р or Q 

Р хог Q 

Not Р 

Not Q 

1 

1 

1 

1 

0 

0 

0 

1 

0 

0 

1 

1 

0 

1 

0 

1 

0 

1 

1 

1 

0 

0 

0 

0 

0 

0 

1 

1 


Описания команд даются в однообразном формате и 
состоят из нескольких частей. Ниже показаны сокраще¬ 
ния и форматы, принятые в описании. 

Первая строка содержит ассемблерную мнемонику, 
описание команды и процессор іАРХ, в котором появи¬ 
лась команда. 

Первая основная часть содержит различные коды 
операции, ассемблерные форматы и время выполнения, 
выраженное в тактах синхронизации. Для циклических 
команд приведено время с префиксом REP и без него. 
Некоторые команды, например, JMP и CALL, имеют до¬ 
полнительный столбец, поясняющий тип команды. 

Приведем смысл значений в столбце кода операции: 


hh Две 16-ричные цифры, определяющие точный 
байт. 

[г] Стандартный байт ModRM; после него могут 

идти байт SIB и/или смещение памяти. 

[п] Когда «п» есть цифра от 0 до 7, это байт 
ModRM с полем reg, содержащим эту цифру 
(цифра — это расширение кода операции), 
ib Непосредственный байт, 

iw Непосредственное слово, 

id Непосредственное двойное слово. 
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db 8-битное знаковое значение, прибавляемое к 
(Е)ІР для получения адреса перехода в ко¬ 
мандах перехода и вызова, 
dw 16-битное знаковое значение, прибавляемое к 
(Е)ІР для получения адреса перехода в ко¬ 
мандах перехода и вызова, 
d Смещение операнда в памяти в конкретном 
сегменте; длина 16 или 32 бита, 
dd 32-битное знаковое значение, прибавляемое к 
(Е)ІР для получения адреса перехода в 
командах перехода и вызова, 
pd 32-битный указатель; первые 16 бит — это 

селектор сегмента, а вторые 16 
бит — смещение в сегменте, 
рр 48-битный указатель; первые 16 бит — это 

селектор сегмента,' а следующие 32 би¬ 
та — смещение в сегменте. 


В столбце формата применяются такие же обозначе¬ 
ния, как и в столбце кода операции для представления 
операндов команды. Смысл их тот же. Иногда в этом 
столбце применяются имена регистров или явные числа 
для представления операндов. Применяются также до¬ 

полнительные обозначения: 

г/ mb Операндом является содержимое байтного ре¬ 
гистра или ячейки памяти, определяемых 

байтом ModRM. 

r/mw Операндом является содержимое словного ре¬ 
гистра или ячейки памяти, определяемых 

байтом ModRM. 

r/md Операндом является содержимое двухсловного 
регистра или ячейки памяти, определяемых 

байтом ModRM. 

rb Операндом является содержимое байтного 

регистра, определяемого байтом ModRM. 
rw Операндом является содержимое словного 

регистра, определяемого байтом ModRM. 
rd Операндом является содержимое двухсловного 
регистра, определяемого байтом ModRM. 
mb Операндом является содержимое байта в 

ячейке памяти, определяемой байтом ModRM. 
mw Операндом является содержимое слова в 

ячейке памяти, определяемой байтом ModRM. 
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md Операндом является содержимое двойного 
слова в ячейке памяти, определяемой байтом 
ModRM. 

mw:w Операндом является указатель в ячейке па¬ 
мяти, определяемой байтом ModRM; указа¬ 
тель содержит 16 бит селектора сегмента и 
16 бит смещения. 

mw:d Операндом является указатель в ячейке па¬ 
мяти, определяемой байтом ModRM; указа¬ 
тель содержит 16 бит селектора сегмента и 
32 бита смещения. 

Столбец «такты» содержит время выполнения ко¬ 
манды в тактах синхронизации. Если два значения раз¬ 
делены наклонной чертой, то первое относится к опе¬ 
рандам в регистрах, а второе — к операндам в памяти. 
Иногда здесь приводятся формулы, которые сразу же 
поясняются. Например, команды передачи управления 
обычно содержат элемент «7+т». Здесь «т» означает 
число компонент в следующей выполняемой команде. 
Компонентом могут быть: байт префикса, каждый байт 
кода операции, любой байт ModRM, любой байт SIB, 
любое значение смещения или любое непосредственное 
значение. 

В следующей части показано, как команда влияет 
на флажки. Пробел означает, что флажок не изменяет¬ 
ся. Цифры 0 и 1 показывают новое состояние флажка. 
Буква «О» означает, что состояние флажка не определе¬ 
но, а буква «S» — флажок устанавливается или сбрасы¬ 
вается в зависимости от результата команды. 

Следующая часть содержит псевдокод, т. е. полу¬ 
формальное описание операции команды. Такое алгорит¬ 
мическое описание взято из языков высокого уровня. 

Далее подробно описывается функция команды. 
Приведены необходимые пояснения о времени выполне¬ 
ния, кодах операции и операндах. 

Затем описаны все особые случаи, которые могут 
возникнуть при выполнении команды. Режим обознача¬ 
ется одной буквой: «Р» — защищенный режим, «R» — 
реальный режим и «V» — режим виртуального 8086. 

Примечания для пользователя содержат дополни¬ 
тельную информацию о команде: применения, тонкости 
и вопросы совместимости. 

В заключение дается пример использования коман¬ 
ды. Он носит иллюстративный характер и не всегда со¬ 
ответствует практике программирования. 
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ААА 

Инструкции процессора 80386 

ASCII -коррекция AL 


для сложения (8086) 

кйп 

Формат Такты 

37 

ААА 4 

Флажки 




NT 

IOPL 

OF 

DF 

IF 

TF 

SF 

ZF 


AF 


PF 


CF 

0 



и 




и 

и 

0 

71 

0 

U 

T 

S 


Псевдокод 

IF (младшая тетрада AL>9) ИЛИ (AF=1) THEN 
инкремент AL на 6 
сбросить старшую тетраду AL на О 
инкремент АН на 1 
установить CF и AF 
ELSE 

сбросить CF и AF 
END IF 


Операция 

Превращает содержимое AL в неупакованное десяти¬ 
чное слово. 


Особые случаи 


Нет. 
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Примечания 


Применяется после сложения десятичных цифр и 
преобразует результат сложения в десятичную цифру. 


Пример 

MOV АХ,8 ; Загружает 8 в AL и АН=0. 

ADD AL,6 ; Прибавить к AL число 6. 

ААА ; АХ=104Н, CF=AF=1. 




90 _ Инструкции процессора 80386 _ 

AAD ASCII -коррекция AL 
до деления (8086) 

КОП Формат Такты 

D5 0А AAD 19 

Флажки 



NT 

IOPL 

OF 

DF 

IF 

TF 

SF 

ZF 


ЛР 


PF 


CF 

0 



и 




Г 

S 

0 

и 

0 

S 

1 

U 


Псевдокод 

Установить AL на (AL+(10*AH)) 
Установить АН на 0 


Операция 

Превращает неупакованное десятичное число в дво¬ 
ичное. Максимальное десятичное значение в 16-битном 
регистре 99. Оно помещается в AL, поэтому АН уста¬ 
навливается на 0. 


Особые случаи 


Нет. 
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Примечания 

Используется до деления неупакованных десятичных 
чисел. Применяется редко. 

Команда действует только на BCD -цифру. Для пре¬ 
образования AL из ASCII в BCD воспользуйтесь коман¬ 
дой AND AL,15. 


Пример 


MOV АХ,1405Н ; Загружает делимое (45) в АХ. 

MOV BL,3 ; Загружает делитель в BL. 

AAD ; Результат 45 (десятичный). 

IDIV BL ; Осуществляет деление, результат 


ААМ 


АХ содержит 105Н или 15 в BCD. 
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ААМ ASCII -коррекция AL 
после умножения 
( 8086 ) 

КОП Формат Такты 

D4 0А ААМ 17 


Флажки 


_1 

NT 

IOPL 

OF 

DF 

3 

TF 

SF 

ZF 


AF 

_1 

PF 


CF 

7 | 



и 


L 


S 

S 

0 

и 

7 ] 

S 

1 

и 


Псевдокод 

Разделить AL на 10 
Поместить частное в АН 
Поместить остаток в AL 


Операция 

Преобразует число из AL, меньшее, чем 100, в не¬ 
упакованное BCD -число в АХ. 


Особые случаи 


Нет. 
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Примечания 

Используется после умножения неупакованных BCD - 
цифр. Результат MUL всегда не больше, чем 9x9=81, 
поэтому условие AL<100 удовлетворяется. Применяется 
редко. 

Команда работает только с BCD -числами. Для пре¬ 
образования AL из ASCII в BCD воспользуйтесь коман¬ 
дой AND AL.15. 


Пример 

См. пример для команды AAD. 
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AAS ASCII -коррекция AL 
после вычитания 
( 8086 ) 

КОП Формат Такты 

3F AAS 4 

Флажки 



NT 

IOPL 

OF 

DF 

IF 

TF 

SF 

ZF 




PF 


CF 

0 



и 




и 

и 

0 

71 

0 

и 

1 

S 


Псевдокод 

IF (младшая тетрада AL>9) OR (AF=1) THEN 
декремент AL на 6 
установить старшую тетраду AL на 0 
декремент АН на 1 
установить флажки AF и CF 
ELSE 

сбросить флажки AF и CF 
END IF 


Операция 

Команда изменяет AL на неупакованное десятичное 
число и корректирует его с привлечением AF. Значение 
AF и размер младшей тетрады AL показывают, нужен 
ли десятичный перенос. 
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Особые случаи 
Нет. 


Примечания 

Команда используется после вычитания BCD -цифр и 
преобразует результат двоичного вычитания в BCD -фор¬ 
мат (учитывая вычитание). Применяется редко. 

Команда AAS осуществляет преобразование двоично¬ 
го числа в BCD. Для преобразования AL в ASCII вос¬ 
пользуйтесь командой OR AL,48. 


Пример 


Загружает BCD 25 в АХ. 

Вычитает 8 из AL (давая OFDH). 
АХ содержит 107Н, т. е. 17. 

Оба флажка CF и AF содержат 1. 


MOV АХ.205Н 
SUB AL,8 
AAS 
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ADC Сложение 

с переносом (8086) 


КОП Формат Такты 


14 

ib 


ADC AL,ib 

2 

15 

iw 


ADC AX,iw 

2 

15 id 


ADC EAX,id 

2 

80 

[2] 

ib 

ADC r/mb,ib 

2/7 

81 

[2] 

iw 

ADC r/mw,iw 

2/7 

81 

[2] 

id 

ADC r/md,id 

2/7 

83 

[2] 

ib 

ADC r/mw,ib 

2/7 

83 

[2] 

ib 

ADC r/md,ib 

2/7 

10 

[г] 


ADC r/mb,rb 

2/7 

11 

[г] 


ADC r/mw,rw 

2/7 

11 

[г] 


ADC r/md,rd 

2/7 

12 

[г] 


ADC rb,r/mb 

2/6 

13 

[г] 


ADC rm,r/mw 

2/6 

13 

[г] 


ADC rd,r/md 

2/6 

Флажки 





NT 

IOPL 

OF 

DF 

IF 

TF 

SF 

ZF 


AF 


PF 


CF 

0 



S 

_ 



S 

0 

0 

S 

0 

0 

1 

S 


Псевдокод 

IF (источник имеет меньше бит, чем получатель) 
THEN 

расширить операнд источника со знаком 
END IF 

Сложить источник и получатель, поместить результат 
в получатель 

Прибавить CF к получателю, поместить результат в 
получатель 
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Операция 

Суммирует два числа, являющихся операндами, и 
значение из бита CF. Первый операнд заменяется ре¬ 
зультатом, а второй не изменяется. 


Особые случаи Режимы Причины 


Р Результат в защищенном от 

записи сегменте 

Р Недопустимый эффективный 

адрес памяти в сегментах CS, 
DS, ES, FS, GS 

Р Неверный адрес в сегменте SS 

Р V Страничное нарушение 

R V Часть операнда вне диапазона 

адреса от 0 до 0FFFFH 


Примечания 

Применяется для сложения повышенной точности, 
чтобы учитывать распространение переноса. 

При программировании необходимо внимательно 
следить за флажком переноса CF. 


#GP(0) 

#GP(0) 


#SS(0) 
#PF (fc) 
INT(13) 


Пример 


MOV 

AX,956 

; Загружает ЗВСН в AX. 

MOV 

BX.373 

; Загружает 175H в BX. 

ADD 

AL,BL 

; Суммирует ОВСН и 75Н. 



; Результат 31Н, CF=1. 

ADC 

AH,BH 

; Суммирует 3 и 1, давая 5 


; (CF-1). 

; Результат в AX 1329 (531H). 


4 Зак. 2046 
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ADD 

Сложение 

(8086) 

коп 

Формат 

Такты 

04 ib 

ADD AL,ib 

2 

05 iw 

ADD AX,iw 

2 

05 id 

ADD EAX,id 

2 

80 [01 ib 

ADD r/mb,ib 

2/7 

81 [0] iw 

ADD r/mw,iw 

2/7 

81 [0] id 

ADD r/md,id 

2/7 

83 [0] ib 

ADD r/mw,ib 

2/7 

83 [01 ib 

ADD r/md,ib 

2/7 

00 [r] 

ADD r/mb,rb 

2/7 

01 [r] 

ADD r/mw,rw 

2/7 

01 [r] 

ADD r/md,rd 

2/7 

02 [r] 

ADD rb,r/mb 

2/6 

03 [r] 

ADD rw,r/mw 

2/6 

03 [r] 

ADD rd,r/md 

2/6 


Флажки 



NT 

IOPL 

OF 

DF 

IF 

TF 

SF 

ZF 


AF 


PF 


CF 

0 



a 




s 

S 

0 

S 

o 

S 

1 

S 


Псевдокод 

IF (источник имеет меньше бит, чем получатель) 
THEN 

расширить источник со знаком 
END IF 

Прибавить источник к получателю, поместить резуль¬ 
тат в получатель 
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Операция 

Суммирует два числа, являющиеся операндами ко¬ 
манды. Первый операнд замещается результатом, второй 
не изменяется. 


Особые случаи Режимы Причины 


#GP(0) 

#GP(0) 


#SS(0) 
#PF (fc) 
INT(13) 


P Результат в защищенном от 

записи сегменте 

Р Недопустимый эффективный 

адрес памяти в сегментах CS, 
DS, ES, FS, GS 

Р Неверный адрес в сегменте S>S 

Р V Страничное нарушение 

R V Часть операнда вне диапазона 

адреса от 0 до 0FFFFH 


Примечания 

Важно понимать, как команда ADD устанавливает 
флажки. 

Предыдущая команда ADC учитывает при сложении 
значение CF. 

По возможности команду ADD следует применять 
вместо ADC, чтобы избежать трудностей из-за непред¬ 
сказуемого состояния флажка CF. 


Пример 


MOV АХ,956 
MOV ВХ.373 
ADD АХ,ВХ 


Загружает ОЗВС в АХ. 

Загружает 175Н в ВХ. 

АХ содержит сумму 1329 (531Н). 
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AND Логическое И (8086) 


КОП Формат Такты 


24 

ib 

AND AL,ib 

2 

25 

iw 

AND AX,iw 

2 

25 

id 

AND EAX.id 

2 

80 

14] ib 

AND r/mb,ib 

2/7 

81 

[4] iw 

AND r/mw,iw 

2/7 

81 

[4] id 

AND r/md.id 

2/7 

20 

[r] 

AND r/mb.rb 

2/7 

21 

[r] 

AND r/mw,rw 

2/7 

21 

[r] 

AND r/md,rd 

2/7 

22 

[r] 

AND rb,r/mb 

2/6 

23 

[r] 

AND rw,r/mw 

2/6 

23 

[r] 

AND rd,r/md 

2/6 


Флажки 



NT 

IOPL 

OF 

DF 

IF 

TF 

SF 

ZF 


3 


PF 


CF 

_ 

o] 



-P. 




T 

S 

0 

1 

0 

S 

1 

0 


Псевдокод 

REPEAT 

IF если бит получателя 1 и бит источника 1 
THEN 

оставить бит в получателе равным 1 
ELSE 

сбросить бит получателя в 0 
END IF 

UNTIL до проверки всех бит в получателе 
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Операция 

Команда AND выполняет логическую функцию И 
над двумя операндами (см. табл. 4.1). Ее можно исполь¬ 
зовать только с операндами одинакового размера. 


Особые случаи Режимы Причины 

#GP(0) Р Результат в защищенном от 

записи сегменте 

#GP(0) Р Недопустимый эффективный 

адрес памяти в сегментах CS, 
DS, ES, FS, GS 

#SS(0) Р Неверный адрес'в сегменте SS 

#PF(fc) Р V Страничное нарушение 

INTG3) R V Часть операнда вне диапазона 

адреса от 0 до 0FFFFH 


Примечания 

Команда AND часто применяются для сброса опре¬ 
деленных бит, например, AND AL,15. Она использова¬ 
лась в старых процессорах 1АРХ 86 для проверки бит и 
функций графики, но теперь эти функции эффективнее 
реализуют команды проверки бит. 


Пример 

MOV АХ.5963Н ; Загружает 16-ричное число в 
; АХ. 

MOV ВХ,6СА5Н ; Загружает 16-ричное число в 
; ВХ. 

AND АХ,ВХ ; Теперь АХ содержит 4821Н. 
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BOUND Контроль 
попадания 
в диапазон (80186) 

КОП Формат Такты 

62 [г] BOUND rw,mw 10* 

62 [г] BOUND rw,md 10* 

*Число тактов без вызова прерывания 5. 


Флажки 



NT 

IOPL 

OF 

DF 

IF 

TF 

SF 

ZF 


AF 


PF 


CF 

0 









0 


0 


1 



Псевдокод 

IF (первый операнд<слова, адресованного вторым опе¬ 
рандом) OR 

(первый операнд>слова, следующего после слова, 
адресуемого вторым операндом) 

THEN 
INT 5 
END IF 


Операция 

Применяется для контроля нахождения значения 
внутри или вне диапазона. Если значение внутри диапа¬ 
зона, никакого действия не предпринимается, иначе ге¬ 
нерируется прерывание 5. Команда предназначена для 
компиляторов с целью контроля индекса массива. 
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Первый операнд (регистр) содержит индекс массива, 
а второй служит указателем памяти. В памяти находят¬ 
ся два слова: нижний и верхний индексы массива, т. е. 
минимальное и максимальное значения индекса, а не 
адреса концов массива в памяти. Если индекс меньше 
первого слова или больше второго, генерируется преры¬ 
вание 5. Команда BOUND не воздействует на флажки и 
не показывает, какая граница нарушена. 

Особые случаи Режимы Причины 

#GP(0) Р Недопустимый эффективный 

адрес памяти в сегментах CS, 
DS, ES, FS, GS 

#SS(0) Р Неверный адрес в сегменте SS 

#PF(fc) Р V Страничное нарушение 

#UD Р Второй операнд определяет 

регистр 

INT(5) Р R V Нарушена граница 

INT(13) Р V Часть операнда вне диапазона 

адреса от 0 до 0FFFFH 

Примечания 

Команда BOUND удобна для контроля границ мас¬ 
сива, но ее реализация запутана. Проще было устано¬ 
вить OF, когда нарушена граница, а флажком SF ука¬ 
зать неверный индекс. Вместо этого генерируется преры¬ 
вание и необходимо позаботиться об обработке прерыва¬ 
ния. Можно или полностью обработать ошибку, или ус¬ 
тановить флажок ошибки, вернуть управление програм¬ 
ме, а в ней предусмотреть переход по флажку к нужно¬ 
му обработчику ошибки. 

Пример 

MOV WORD PTR BND,0 ; Нижняя граница 

; 0 . 

MOV WORD PTR BND+2,99 ; Верхняя граница 

; 99. 

MOV AX, 100 ; Контролируемое 

; значение в AX. 

BOUND AX,BND ; Вызывает преры- 

; вание 5. 



104 


Инструкции процессора 80386 


BSF Сканирование бита 
вперед (80386) 

Формат Такты 

BSF rw,r/mw 10+Зп* 

BSF rd,r/md 10+Зп* 

пропущенных нулей 

Флажки 


КОП 

0F ВС [г] 
0F ВС [г] 

"■п — число 



NT 

IOPL 

OF 

DF 

IF 

TF 

SF 

ZF 


AF 


PF 


CF 

0 








S 

0 


0 


1 



Псевдокод 

IF второй операнд равен нулю THEN 

Установить ZF 

Установить первый операнд на неопределенное 
значение 

ELSE 

Сбросить ZF 

Выбрать младший бит (бит 0) второго операнда 

DO WHILE выбранный бит=0 (не делать, если 
бит 0=1) 

Выбрать следующий старший бит 

END DO 

Скопировать индекс выбранного бита в первый 
операнд (индекс равен 0—15 или 0—31) 

END IF 
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Операция 

Команда BSF находит первый единичный бит во 
втором операнде (слово или двойное слово в регистре 
или памяти). Поиск начинается с бита 0 и прекращает¬ 
ся при обнаружении 1. Во второй операнд помещается 
индекс (номер разряда) единичного бита. 


Особые случаи Режимы Причины 


#GP (0) 

P 

Недопустимый эффективный 

адрес памяти в сегментах CS, 
DS, ES, FS, GS 

#SS(0) 

P 

Неверный адрес в сегменте SS 

#PF (fc) 

P V 

Страничное нарушение 

INT(13) 

P V 

Часть операнда вне диапазона 
адреса от 0 до 0FFFFH 

Примечания 

Новые 

команды 

манипуляций бцтами упрощают 


многие программы (например, построение таблиц разме¬ 
щения, в которых состояние бита показывает, заняты 
или нет область RAM или сектор диска). Команда BSF 
позволяет быстро найти первый ненулевой бит (возмож¬ 
но, первый распределенный сектор на диске). Простой 
цикл может найти первое ненулевое слово или двойное 
слово в таблице распределения секторов, а затем коман¬ 
да BSF найдет первый ненулевой бит. 


Пример 

MOV 


BSF 


BX,3CD0H 

АХ,ВХ 


; В ВХ просматриваемое зна- 
; чение. 

; АХ=4, ZF=0. 
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BSR 

Сканирование бит 
назад (80386) 

КОП 

Формат 

Такты 

OF BD [г] 
OF BD [r ] 

BSR rw,r/mw 
BSR rd,r/md 

10+3n* 

10+3n* 


*п — число пропущенных нулевых бит. 


Флажки 



NT 

IOPL 

OF 

DF 

IF 

TF 

SF 

ZF 


AF 


PF 


CF 

0 








S 

0 


0 


1 



Псевдокод 

IF второй операнд равен нулю THEN 

Установить ZF 

Установить первый операнд на неопределенное 
значение 

ELSE 

-Сбросить ZF 

Выбрать старший бит (бит 15 или 31) второго 
операнда 

DO WHILE выбранный бит=0 (не делать, если 
бит 15-1) 

Выбрать следующий младший бит 

END DO 

Скопировать индекс выбранного бита в первый 
операнд (индекс равен 0—15 или 0—31) 

END IF 
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Операция 

Команда BSR находит первый единичный бит во 
втором операнде (слово или двойное слово в регистре 
или памяти). 

Просмотр начинается со старшего бита и останавли¬ 
вается при обнаружении единичного бита. Индекс (но¬ 
мер разряда) единичного бита помещается во второй 
операнд. 


Особые случаи Режимы Причины 


#GP(0) 

Р 

Недопустимый эффективный 

#SS(0) 

Р 

адрес памяти в сегменте CS, 
DS, ES, FS, GS 

Неверный адрес в сегменте SS 

#PF(fc) 

Р V 

Страничное нарушение 

INT(13) 

R V 

Часть операнда вне диапазона 



адреса от 0 до 0FFFFH 

Примечания 

Новые 

команды 

манипуляций битами упрощают 


многие программы (например, построение таблиц разме¬ 
щения, в которых состояние бита показывает, свободны 
ли область RAM или сектор на диске). Команда BSR 
позволяет быстро найти первый ненулевой бит (возмож¬ 
но, первый распределенный сектор на диске). Используя 
обычный цикл можно найти первое ненулевое слово или 
двойное слово в таблице размещения секторов, а затем 
командой BSR определить первый ненулевой бит. 


Пример 


MOV BX,3CD0H ; Просматриваемое значение в 
; ВХ. 

BSR АХ,ВХ ; АХ=13, ZF=0. 
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ВТ Проверка бита (80386) 


КОП 


Формат 

Такты 

0F 

АЗ 

[r I 

ВТ r/mw,rw 

3/12 

OF 

АЗ 

[г] 

ВТ r/md,rd 

3/12 

OF 

BA 

[4] ib 

ВТ r/mw,ib 

3/6 

OF 

BA 

[4] ib 

ВТ r/md,id 

3/6 


Флажки 



NT 

IOPL 

OF 

DF 

IF 

TF 

SF 

ZF 


AF 


PF 


CF 

0 









0 


_ 

0 


l 4 

S 


Псевдокод 

Использовать первый операнд для локализации реги¬ 
стра или ячейки памяти. 

Использовать второй операнд для выбора бита (бит 
0 — младший). 

Передать выбранный бит в CF. 


Операция 

Команда ВТ позволяет выбрать любой бит и пере¬ 
дать его во флажок CF. Первый операнд — регистр или 
ячейка памяти. Второй операнд содержит номер бита. 
Им может быть любое беззнаковое целое до 8 бит, но в 
зависимости от размера первого операнда используются 
только младшие 4 или 5 бит. Проверяемый бит не из¬ 
меняется. 
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Особые случаи Режимы Причины 


#GP(0) 

#GP(0) 


#SS(0) 

#PF(fc) 

INT(13) 


P Результат в защищенном 

записи сегменте 

Р Недопустимый эффективный 

адрес памяти в сегментах CS, 
DS, ES, FS, GS 

Р Неверный адрес в сегменте SS 

Р V Страничное нарушение 

R V Часть операнда вне диапазона 

адреса от 0 до 0FFFFH 


Примечания 

Новые команды манипуляций битами упрощают 
многие программы (например, построение таблиц разме¬ 
щения, в которых состояние бита показывает, свободны 
ли область RAM или сектор на диске). Команда ВТ 
обеспечивает быстрый доступ к любому биту в таблице. 
Она же упрощает управление дисплейным буфером. 


Пример 

MOV AX,3CD0H ; Просматриваемое значение в 
; АХ. 

ВТ АХ, 10 ; Устанавливает CF. 




по 
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ВТС Проверка бита и 


коп 

OF ВВ 
OF ВВ 
OF ВА 
OF ВА 


инвертирование 

(80386) 



Формат 

Такты 

[Г] 

BTC r/mw,rw 

6/13 

[г) 

BTC r/md,rd 

6/13 

[7] ІЬ 

BTC r/mw,ib 

6/8 

[7] ib 

BTC r/md,id 

6/8 


Флажки 



NT 

IOPL 

OF 

DF 

IF 

TF 

SF 

ZF 


AF 


PF 


CF 

0 

_ 








0 


0 


1 

S 


Псевдокод 

Использовать первый операнд для локализации реги¬ 
стра или ячейки памяти. 

Использовать второй операнд для выбора бита (бит 
0 — младший). 

Передать выбранный бит в CF. 

Инвертировать выбранный бит. 


Операция 

Команда BTS выполняет две функции. Во-первых, 
она позволяет программисту инвертировать любой бит в 
регистре или ячейке памяти. Во-вторых, она помещает 
старое значение бита в CF. 

Первый операнд — регистр или ячейка памяти, 
второй — номер бита. Им может быть любое беззнако- 
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вое целое до 8 бит, но в зависимости от размера перво¬ 
го операнда используются только 4 или 5 бит. 


Особые случаи Режимы Причины 


#GP(0) 

P 

Результат в защищенном от 
записи сегменте 

#GP(0) 

P 

Недопустимый эффективный 

адрес памяти в сегментах CS, 
DS, ES, FS, GS 

#SS(0) 

P 

Неверный адрес в сегменте SS 

#PF (fc) 

P V 

Страничное нарушение 

INT(13) 

R V 

Часть операнда вне диапазона 
адреса от 0 до 0FFFFH 

Примечания 

Новые 

команды 

манипуляций битами упрощают 


многие программы (например, построения таблиц разме¬ 
щения, в которых состояние бита показывает, свободны 
ли область RAM или сектор на диске). Команда BTS 
позволяет быстро инвертировать любой бит в таблице. 
Она не упрощает управление дисплейным буфером. 


Пример 

MOV AX,3CD0H ; Просматриваемое значение в 
; АХ. 

ВТС АХ,2 ; AX=3CD4H, CF-0. 
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BTR Проверка бита и 
сброс (80386) 


КОП 


Формат 

Такты 

0F 

ВЗ 

[г] 

BTR r/mw,rw 

6/13 

OF 

ВЗ 

[г] 

BTR r/md,rd 

6/13 

OF 

BA 

[6] ib 

BTR r/mw,ib 

6/8 

OF 

BA 

[6] ib 

BTR r/md,ib 

6/8 


Флажки 



NT 

IOPL 

OF 

DF 

IF 

TF 

SF 

ZF 


AF 


PF 


CF 

0 









0 


0 

L 

1 

S 


Псевдокод 

Использовать первый операнд для локализации реги¬ 
стра или ячейки памяти. 

Использовать второй операнд для выбора одного бита 
(бит 0 — младший). 

Передать выбранный бит в CF. 

Сбросить выбранный бит (в 0). 


Операция 

Команда BTR выполняет две функции. Во-первых, 
она позволяет выбрать любой бит в регистре или памя¬ 
ти и сбросить его. Во-вторых, она помещает прежнее 
значение бита в CF. 

Первый операнд — регистр или ячейка памяти, 
второй — номер бита. Им может быть любое беззнако¬ 
вое целое до 8 бит, но в зависимости от размера перво¬ 
го операнда используются только 4 или 5 бит. 
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Особые случаи Режимы Причины 

#GP(0) Р Результат в защищенном о 

записи сегменте 

#GP(0) Р Недопустимый эффективный 

адрес памяти в сегментах CS. 
DS, ES, FS, GS 

#SS(0) Р Неверный адрес в сегменте SS 

#PF(fc) Р V Страничное нарушение 

INT(13) R V Часть операнда вне диапазона 

адреса от 0 до 0FFFFH 


Примечания 

Новые команды манипуляций битами упрощают 
многие программы (например, построение таблиц разме¬ 
щения, в которых состояние бита показывает, свободны 
ли область RAM или сектор на диске). Команда BTR 
позволяет быстро сбросить любой бит в таблице. Она же 
упрощает управление дисплейным буфером. 


Пример 

MOV AX,3CD0H ; Просматриваемое значение 
; АХ. 

BTR АХ,7 ; АХ-ЗС50Н, CF=1. 
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BTS Проверка бита и 
установка (80386) 


КОП 


Формат 

Такты 

OF АВ 

[г] 

BTS r/mw,rw 

6/13 

0F АВ 

[г] 

BTS r/md,rd 

6/13 

OF ВА 

[5] ІЬ 

BTS r/mw,ib 

6/8 

OF ВА 

15] ib 

BTS r/md,ib 

6/8 


Флажки 



NT 

IOPL 

OF 

DF 

IF 

TF 

SF 

ZF 


AF 


PF 


CF 

0 







— 


0 


0 


1 

S 


Псевдокод 

Использовать первый операнд для локализации реги¬ 
стра или ячейки памяти. 

Использовать второй операнд для выбора бита (бит 
0 — младший). 

Передать выбранный бит в CF. 

Установить выбранный бит (в 1). 


Операция 

Команда BTS выполняет две функции. Во-первых, 
она позволяет программисту выбрать любой бит и уста¬ 
новить его в 1. Во-вторых, она помещает старое значе¬ 
ние бита в CF. 

Первый операнд — регистр или ячейка памяти, 
второй — номер бита. Им может быть любое беззнако¬ 
вое целое до 8 бит, но в зависимости от размера перво¬ 
го операнда используются только 4 или 5 бит. 
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Особые случаи Режимы Причины 


#GP(0) 

P 

Результат в защищенном от 
записи сегменте 

#GP(0) 

P 

Недопустимый эффективный 

адрес памяти в сегментах CS, 
DS, ES, FS, GS 

#ss 

P 

Неверный адрес в сегменте SS 

#PF(fc) 

P V 

Страничное нарушение 

INT(13) 

R V 

Часть операнда вне диапазона 
адреса от 0 до 0FFFFH 

Примечания 

Новые 

команды 

манипуляций битами упрощают 


многие программы (например, построение таблиц разме¬ 
щения, в которых состояние бита показывает, свободна 
ли область RAM или сектор на диске). Команда BTS 
позволяет быстро установить любой бит в таблице (на¬ 
пример, отмечая распределение сектора). Она упрощает 
управление дисплейным буфером. 


Пример 

MOV 


BTS 


AX.3CD0H 
АХ,2 


Просматриваемое значение в 
АХ. 

AX=3CD4H, CF=0. 
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CALL Вызов процедуры 
( 8086 ) 


КОП 

Формат 

Тип 

Такты 

Е8 dw 

CALL dw 

короткий, прямой 

7+т 

Е8 dd 

CALL dd 

короткий, прямой 

7+ш 

FF [2] 

CALL r/mw 

короткий, косвенный 

7+m/10+m 

FF [2] 

CALL r/md 

короткий, косвенный 

7+m/10+m 

9A pd 

CALL pd 

длинный, прямой 

17+m,* 

9A pp 

CALL pp 

длинный, прямой 

17+m,* 

FF [3] 

CALL mw:w 

длинный, косвенный 

22+m,* 

FF [3] 

CALL mw:d 

длинный, косвенный 

22+m,* 


*Эти команды имеют другие функции и времена выпол¬ 
нения в защищенном режиме (см. гл. 5). 


Флажки 

Обычно команда CALL не воздействует на флажки. 
Но при переключении задачи в защищенном режиме все 
флажки принимают значения заполненных флажков но¬ 
вой задачи. 


Псевдокод 

IF межсегментный CALL THEN 
PUSH CS в стек 

Установить CS на селектор сегмента операнда 
END IF 

PUSH IP в стек 

Установить IP на смещение операнда 


Операция 

Команда CALL применяется для передачи управле¬ 
ния другой части программы с возможностью возврата в 
точку вызова. Она позволяет реализовать процедуры, 
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функции и подпрограммы в языках высокого уровня и 
удобна в языке ассемблер. 

Имеется 4 типа команд CALL: короткая ц длинная, 
прямая и косвенная. 

Если вызываемая процедура находится в том же 
сегменте, что и вызывающая программа, то вызов назы¬ 
вается коротким, а если в другом, то длинным. В слу^ 
чае длинного вызова в стек необходимо включить содер¬ 
жимое регистров CS и IP, а в случае коротко¬ 
го — только IP. 

В зависимости от определения адреса вызываемой 
процедуры вызов может быть прямым или косвенным. 
Прямой вызов содержит адрес в самой команде. В кос¬ 
венном вызове адрес вызываемой процедуры содержит 
указатель на регистр или ячейку памяти. 

Короткий прямой вызов содержит смещение, которое 
прибавляется к IP, а в длинном прямом вызове команда 
содержит полное смещение. Короткий косвенный вызов 
может адресовать регистр или ячейку памяти, содержа¬ 
щие смещение и сегмент для вызываемой процедуры. 
Длинный косвенный вызов не может использовать ре¬ 
гистр, а использует только память (так как полные ука¬ 
затели имеют длину до 48 бит). 

Базовая процедура в защищенном режиме такая же, 
но межсегментные вызовы сложнее, так как команда 
CALL может определять процедуру операционной систе¬ 
мы или даже другую задачу. В любом случае необходи¬ 
мо контролировать защиту памяти (см. гл. 5). 


Особые случаи Режимы Причины 


#NP 

P 

Заданный сегмент кода отсут- 

#TS 

P 

Требуется переключение зада- 

#GP(0) 

P 

Недопустимый эффективный 

адрес памяти в сегментах CS, 
DS, ES, FS, GS 

#SS(0) 

P 

Неверный адрес в сегменте SS 

#PF(fc) 

P V 

Страничное нарушение 

INT(13) 

R V 

Часть операнда вне диапазона 
адреса от 0 до 0FFFFH 
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Примечания 

Команды CALL применяются довольно часто. Одна 
из трудностей связана с передачей параметров вызывае¬ 
мой процедуре. В новых процессорах іАРХ 86 команда 
PUSHA помогает сохранить значение регистров в стеке, 
а команда ENTER помогает реализовать вложенные про¬ 
цедуры. Вопросы о том, когда использовать процедуры 
вместо копий секций кода и когда скопировать процеду¬ 
ру в каждый сегмент вместо использования межсегмент¬ 
ных вызовов, довольно сложны. 


Пример 


CALL SUBROUTINE 
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CBW Преобразование 

байта в слово (8086) 

CWDE Преобразование 
слова в двойное 
слово (80386) 

КОП Формат Такты 

98 CBW 3 

98 CWDE 3 


Флажки 



NT 

IOPL 

OF 

DF 

IF 

TF 

SF 

ZF 


AF 


PF 


CF 

0 





_ 




0 


0 


1 



Псевдокод 

IF размер операнда=16 бит THEN (*CBW*) 

Установить все биты АН на значение старшего 
бита AL. 

ELSE (*CWDE*) 

Установить старшие 16 бит ЕАХ на значение 
старшего бита АХ. 

END IF 


Операция 

Преобразование байта в слово осуществляется путем 
расширения знака: старший бит байта копируется во все 
биты слова, не занятые байтом. Преобразование слова в 
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двойное слово производится аналогично. Отметим, что 
расширение знака в дополнительном коде сохраняет зна¬ 
чение. 


Особые случаи 
Нет. 


Примечания 

Эти команды применяются для увеличения размера 
числа. 

Пример 

MOV AL.0FCH ; Загружает -4 в AL. 

CBW ; AX=0FFFCH (тоже -4). 
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CLC 

Сброс флажка 


переноса (8086) 

КОП 

Формат Такты 

F8 

CLC 2 

Флажки 




NT 

IOPL 

OF 

DF 

IF 

TF 

SF 

ZF 


AF 


PF 


CF 

0 









0 


_ 

0 


1 

0 


Псевдокод 

Сбросить CF в нуль. 

Операция 

Флажок CF сбрасывается в нуль. 

Особые случаи 
Нет. 

Примечания 

Применяется до цикла суммирования чисел длиной 
в несколько базовых единиц, чтобы в самом цикле 
пользоваться только командой ADC. Кроме того, в се¬ 
мействе іАРХ требуется, чтобы CF был сброшен перед 
командой SBB (вычитание с заемом), если ей не пред¬ 
шествует команда SUB. 

Пример 


CLC ; Сбрасывает CF. 
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CLD Сброс флажка 

направления (8086) 

КОП Формат Такты 

FC CLD 2 

Флажки 



NT 

IOPL 

OF 

DF 

IF 

TF 

SF 

ZF 


AF 


PF 


CF 

0 









0 


0 


1 



Псевдокод 

Сбросить флажок DF в нуль. 

Операция 

Флажок DF сбрасывается в нуль. 

Особые случаи 
Нет. 

Примечания 

Флажок DF управляет направлением циклических 
операций. Когда DF=0, то после каждого повторения 
циклической операции производится инкремент индекс¬ 
ных регистров SI и/или DI. Это «обычное» направление 
от младших адресов к старшим. При DF=1 производится 
декремент SI и/или DI. 

Пример 


CLD ; Сбрасывает DF. 
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CLI Сброс флажка 
разрешения 
прерываний (8086) 

КОП Формат Такты 

FA CLI 3 

Флажки 



NT 

IOPL 

OF 

DF 

IF 

TF 

SF 

ZF 


AF 


PF 


CF 

0 



0 






0 


0 


1 



Псевдокод 

Сбросить флажок IF в нуль. 


Операция 

Сбрасывает флажок IF в 0, запрещая восприятие 
прерываний. В защищенном режиме 80286 и 80386 име¬ 
ются сложности. Команда CLI не выполняется, если те¬ 
кущий уровень привилегий программы, выполняющей 
CLI, больше (т. е. она менее привилегирована), чем со¬ 
держат биты уровня привилегий ввода/вывода в регистре 
Flags. 


Особые случаи Режимы Причины 

#GP(0) Р Текущая привилегия больше 

IOPL 
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Примечания 

Эта команда важна для критических секций, кото¬ 
рые нельзя прерывать. Запрещается прерывание от кла¬ 
виатуры, чтобы пользователи не пытались прервать про¬ 
грамму. 

Необходимо разобраться в уровнях привилегий за¬ 
щищенного режима, прежде чем пытаться управлять 
прерываниями из своей программы. 


Пример 


CLI ; Сбрасывает IF. 
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СМС Инвертирование 
флажка переноса 
( 8086 ) 

КОП Формат Такты 

F5 СМС 2 

Флажки 



NT 

IOPL 

OF 

DF 

IF 

TF 

SF 

ZF 


AF 


PF 


CF 

0 









0 

_ 

0 


1 

S 


Псевдокод 

IF (CF=0) THEN 

установить флажок CF 
ELSE 

сбросить флажок CF 
END IF 


Операция 

Команда СМС инвертирует флажок CF. 


Особые случаи 


Нет. 
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Примечания 

Эта команда удобна при использовании CF как па¬ 
раметра внутри программы. Если состояние CF известно, 
не пользуйтесь командой СМС, а применяйте CLC или 
STC (программу проще сопровождать). 


Пример 


СМС ; Изменяет состояние CF. 
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СМР 

Сравнение (8086) 

коп 

Формат 

Такты 

ЗС ib 

CMP AL,ib 

2 

3D iw 

CMP AX,iw 

2 

3D iw 

CMP EAX,id 

2 

80 [7] id 

CMP r/mb,ib 

2/5 

81 [7] iw 

CMP r/mw,iw 

2/5 

81 [7] id 

CMP r/md,id 

2/5 

83 [7] ib 

CMP r/mw,iw 

2/5 

83 [7] ib 

CMP r/md,id 

2/5 

38 [r] 

CMP r/mb,rb 

2/5 

39 [rl 

CMP r/mw,rw 

2/5 

39 [r] 

CMP r/md,rd 

2/5 

ЗА [rl 

CMP rb,r/mb 

2/6 

3B [r] 

CMP rw,r/mw 

2/6 

3B [r] 

CMP rd,r/md 

2/6 

Флажки 





NT 

IOPL 

OF 


IF 

Ц 

SF 

ZF 


AF 


PF 


CF 

0 



S 




S 

S 

0 

S 

0 

S 

1 

S 


Псевдокод 


Вычесть второй операнд из первого, не сохранять ре¬ 
зультат 

Установить флажки по результату вычитания 


Операция 


Команда СМР вычитает второй операнд из первого, 
но нигде не сохраняет результат. Флажки устанавлива¬ 
ются по результату вычитания. 
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Особые случаи Режимы Причины 

#GP(0) Р Недопустимый эффективный 

адрес памяти в сегментах CS, 

DS, ES, FS, GS 

#SS(0) Р Неверный адрес в сегменте SS 

#PF(fc) Р V Страничное нарушение 

INT03) R V Часть операнда вне диапазона 

адреса от 0 до 0FFFFH 


Примечания 

Применяется для сравнения чисел с последующим 
условным переходом. 


Пример 


MOV АХ,956 ; Загружает ЗВСН в АХ. 

MOV ВХ.373 ; Загружает 175Н в ВХ. 

CMP АХ,ВХ ; CF, AF, ZF, SF, OF=0; PF=1. 
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CMPS Сравнение в цикле 
( 8086 ) 


КОП 

Формат 

Такты 

(одиночная) 

Такты 

(с повторением) 

А6 

CMPSB 

10 

5+9*N 

А7 

CMPSW 

10 

5+9*N 

А7 

CMPSD 

10 

5+9* N 


Число N означает число выполненных повторений. 


Флажки 


J 

NT 

IOPL 

OF 

DF 

IF 

TF 

SF 

ZF 


AF 


PF 


CF 




S 




S 

S 

0 

S 

0 

S 

1 

S 


Псевдокод 

Вычесть ES:[(E)DI] из DS:[(E)SI], не сохранять ре¬ 
зультат 

Установить флажки по результату вычитания 
IF DF=0 TNEN 

Прибавить размер операндов (в байтах) к (E)SI и 
(Е) DI 

ELSE 

Вычесть размер операндов (в байтах) из (E)SI и 
(E)DI 

END IF 


Операция 

Команда вычитает получатель из источника, но ни¬ 
где не сохраняет результат. Флажки устанавливаются по 
полученному результату. 

5 Зак. 2046 




130 


Инструкции процессора 80386 


Операнды в команде CMPS не определяются. Пер¬ 
вый из них адресуется индексом источника (E)SI, кото¬ 
рый обычно относится к сегменту данных, если не задан 
префикс замены, а второй — индексом получателя 
(Е)Ш, который во всех циклических командах относится 
к дополнительному сегменту (ES). 

Команда CMPS производит модификацию SI и DI в 
зависимости от состояния флажка направления DF. 
Обычно с ней применяются префиксы REPE и REPNE. 


Особые случаи Режимы Причины 


#GP(0) 


#SS(0) 

#PF(fc) 

INT(13) 


Р Недопустимый эффективный 

адрес памяти в сегментах CS, 

DS, ES, FS, GS 

Р Неверный адрес в сегменте SS 

Р V Страничное нарушение 

R V Часть операнда вне диапазона 

адреса от 0 до 0FFFFH 


Примечания 

Обычно команда CMPS применяется для сравнения 
двух массивов на равенство. В этом случае в регистр 
СХ помещается длина массивов, а в регистры SI и 
DI — адреса первых элементов. После этого команда 
REPE CMPS производит циклические операции: сравне¬ 
ние элементов, продвижение указателей SI и DI и де¬ 
кремент СХ до тех пор, пока два операнда окажутся 
неравными (ZF не равен 0) или СХ исчерпается до ну¬ 
ля. После этого команда JNZ передает управление на 
обработку ситуации несовпадения. 

Команда REPNE выполняет сравнение до достиже¬ 
ния в СХ нуля или обнаружения двух одинаковых эле¬ 
ментов. Так можно убедиться, что все элементы масси¬ 
вов разные. 
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Пример 

STR1 DD 1,2,3,4,5 

STR2 DD 1,2,4,5,6 

Движение вперед. 
Источник DS: [ESI ]. 
Получатель ES: [EDI ]. 
Счетчик повторений. 
Выполняется 3 раза и за¬ 
канчивается с ЕСХ=2, 
DS: [ESI ] показывают на 
4 в STR1, a ES: [EDI ] 
показывают на 5 в STR2. 


LDS ESI.STR1 

LES EDI,STR2 

MOV ЕСХ,5 

REPE CMPSD 
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CWD Преобразование 
слова в двойное 
слово (8086) 

CDQ Преобразование 
двойного слова в 
счетверенное слово 
(80386) 

КОП Формат Такты 

99 CWD 2 

99 CDQ 2 


Флажки 



NT 

IOPL 

OF 

DF 

IF 

TF 

SF 

ZF 


AF 


PF 


CF 

0 






—: 



0 

— 

0 


71 



Псевдокод 

IF размер операнда=16 бит THEN (*CWD*) 

Установить все биты DX на значение старшего 
бита АХ. 

ELSE (*CDQ*) 

Установить все биты EDX на значение старшего 
бита ЕАХ. 


END IF 
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Операция 

Преобразование слова в двойное слово производится 
путем расширения знака, т. е. старший бит слова копи¬ 
руется во все биты второго слова. Значение двойного 
слова в дополнительном коде эквивалентно значению ис¬ 
ходного слова. Команда CDQ действует аналогично. 


Особые случаи 
Нет. 


Примечания 

Обе команды применяются для коррекции размера 
операнда. 


Пример 


MOV AX.OFFFCH 
CWD 


Загружает -4 в АХ. 
DX=OFFFFH, DX:AX равно 
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DAA Десятичная 

коррекция AL после 
сложения (8086) 

КОП Формат Такты 

27 DAA 4 


Флажки 



NT 

IOPL 

OF 

DF 

IF 

TF 

SF 

ZF 


AF 


PF 


CF 

_ 

0 



S 


— 


_ 

S 

S 

0 

S 

_ 

0 

S 

1 

S 


Псевдокод 

IF (младшая тетрада AL>9) OR (AF=1) THEN 
инкремент *AL на 6 
установить AF в 1 
ELSE 

сбросить флажок AF 
END IF 

IF (AL>9FH) OR (CF=1) THEN 
установить AL на AL+60H 
установить CF в 1 
ELSE 

сбросить флажок CF 
END IF 


Операция 

Команда DAA корректирует AL после сложения 
двух упакованных BCD -цифр. В байте находятся две 
цифры, и команда DAA формирует в них правильный 
результат с образованием десятичного переноса в CF. 
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Особые случаи 
Нет. 


Примечания 

Команда DAA часто применяется в цикле сложения 
многобайтных десятичных (BCD) чисел и указывается 
сразу после команды ADC. Она выполняет только преоб¬ 
разование двоичных чисел в BCD -формат. 


Пример 

MOV АХ.18Н ; Загружает BCD -число 18 в AL. 

ADD AL,6 ; Прибавляет BCD -число 6 к AL 

; <“1ЕН). 

DAA ; АХ содержит BCD -число 24, 

; CF-O, AF=1. 
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DAS Десятичная 

коррекция AL после 
вычитания (8086) 

КОП Формат Такты 

2F DAS 4 


Флажки 



NT 

IOPL 

OF 

DF 


TF 

SF 

ZF 


ЛР 


PF 


CF 

_ 

о! 



S 


_ 


S 

S 

0 

S j 

0 

S 

1 

S 


Псевдокод 

IF (младшая тетрада AL>9) OR (AF-1) THEN 
декремент AL на 6 
установить AF в 1 
ELSE 

сбросить флажок AF 
END IF 

IF (AL>9FH) OR (CF-1) THEN 
установить AL на AL-60H 
установить CF в 1 
ELSE 

сбросить флажок CF 
END IF 


Операция 

Команда DAS корректирует AL после вычитания 
двух упакованных BCD -цифр. В байте находятся две 
цифры, и команда DAS формирует в них правильный 
реаультат с образованием десятичного заема в CF. 
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Особые случаи 


Примечания 

Команда DAS часто применяется в цикле вычитания 
многобайтных десятичных (BCD) чисел и указывается 
сразу после команды SBB. Она выполняет только преоб¬ 
разование двоичных чисел в BCD -формат. 


Пример 


MOV 

АХ.16Н 

; Загружает BCD -число в AL. 

SUB 

AL,8 

; Вычитает BCD -число 8 



; AL(-ODH). 

DAS 


; АХ содержит 8, CF=0, AF=1. 
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DEC 

Декремент (8086) 

коп 

Формат 

Такты 

FE [1] 

DEC r/mb 

2/6 

FF [1] 

DEC r/mw 

2/6 

FF [1] 

DEC r/md 

2/6 

48+rw 

DEC rw 

2 

48+rd 

DEC rd 

2 

Флажки 





NT 

IOPL 

OF 

DF 

IF 

TF 

SF 

ZF 


AF 


PF 


CF 

0 



S 




S 

S 

0 

S 

0 

S 

1 



Псевдокод 

Уменьшает операнд на 1. 


Операция 

Вычитает 1 из своего единственного операнда и по¬ 
мещает результат в операнд. 


Особые случаи Режимы Причины 


#GP(0) 

P 

Результат в защищенном от 
записи сегменте 

#GP(0) 

P 

Недопустимый эффективный 

адрес памяти в сегментах CS, 
DS, ES, FS, GS 

#SS(0) 

P 

Неверный адрес в сегменте SS 

#PF (fc) 

P V 

Страничное нарушение 

INT(13) 

R V 

Часть операнда вне диапазона 
адреса от 0 до 0FFFFH 
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Примечания 

Код команды DEC кажется гораздо проще команды 
SUB, но он выполняется почти такое же время. Коман¬ 
да DEC не влияет на флажок CF, поэтому часто лучше 
использовать команду SUB со вторым операндом 1. 


Пример 

MOV АХ,956 ; Загружает ЗВСН в АХ. 

DEC АХ ; Теперь АХ содержит 955 

; (ЗВВН). 
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DIV Беззнаковое деление 
( 8086 ) 


КОП 

Формат 

Такты 

F6 

[6] 

DIV AL,r/mb 

14/17 

F7 

[6] 

DIV AX,r/mw 

22/25 

F7 

[6] 

DIV EAX,r/md 

38/41 



NT 

IOPL 

OF 

DF 


TF 

SF 

ZF 


AF 

Г 



CF 

0 



— 

~ 





0 


7 ] 


1 



Псевдокод 


IF код операции F6 THEN (^делимое слово*) 

разделить АХ на беззнаковый байт из операнда 
сохранить частное в AL 
сохранить остаток в АН 

ELSE IF размер операнда 16 THEN (*делимое двой¬ 
ное слово*) 

разделить DX:AX на беззнаковое слово из опе¬ 
ранда 

сохранить частное в АХ 
сохранить частное в DX 
ELSE (*делимое счетверенное слово*) 

разделить EDXrEAX на беззнаковое двойное слово 
из операнда 

сохранить частное в ЕАХ 
сохранить остаток в EDX 
END IF 
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Операция 

Делимое и делитель считаются беззнаковыми целы¬ 
ми. Частное и остаток как беззнаковые целые помеща¬ 
ются в два регистра. 


Особые случаи Режимы Причины 

#GP(0) Р Результат в защищенном от 

записи .сегменте 

#GP(0) Р Недопустимый эффективный 

адрес памяти в сегментах CS, 
DS, ES, FS, GS 

#SS(0) Р Неверный адрес в сегменте SS 

#PF(fc) Р V Страничное нарушение 

INT(O) Р R V Результат слишком велик для 

получателя или делитель ра¬ 
вен нулю 

INT(13) R V Часть операнда вне диапазона 

адреса от 0 до 0FFFFH 


Примечания 

Команда DIV выполняется долго и ее нужно избе¬ 
гать в критических секциях. При переполнении возника¬ 
ет прерывание, поэтому целесообразно заранее проверить 
возможность деления. 

Делимое и делитель в команде DIV считаются без¬ 
знаковыми (или положительными) числдми. Часто требу¬ 
ется разрабатывать процедуру деления, которая исполь¬ 
зует повторяющиеся команды DIV или IDIV для деле¬ 
ния с большей точностью, чем обеспечивает одна коман¬ 
да DIV или IDIV. 


Пример 


MOV АХ,956 ; Загружает ЗВСН в АХ. 
MOV ВХ,300 ; Загружает 12СН в ВХ. 
DIV АХ,ВХ ; АЬ=3, АН=56. 
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ENTER Образование 

стекового кадра 
для процедуры 
( 80186 ) 


КОП 

Формат 

Такты 

С8 iw 00 

ENTER iw,0 

10 

С8 iw 01 

ENTER iw, 1 

12 

С8 iw ib 

ENTER iw,ib 

15+4xn 

Число «п» 

означает номер 

уровня (первый операнд) 

нус 1. 




Флажки 



NT 

IOPL 

OF 

DF 

IF 

TF 

SF 

ZF 


AF 


PF 


CF 

0 




_ 


_ 



0 


0 


t] 



Псевдокод 

Включить в стек (Е)ВР 
Сохранить копию (E)SP 
IF второй операнд больше 0 THEN 

FOR 1 ТО второй операнд минус I DO 
Декремент (Е)ВР на 2 (или 4) 

Включить в стек слово, адресуемое (Е)ВР 
END DO 

Включить в стек слово, адресуемое сохраненной 
копией (E)SP 

END IF 

Установить (Е)ВР на сохраненную копию (E)SP 
Установить (E)SP на (E)SP минус первый операнд 
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Операция 

Команда ENTER применяется для реализации вызо¬ 
вов процедур и предназначена для языков высокого 
уровня. Обычно при каждом вызове в стек включаются 
4 элемента: аргументы процедуры, адрес возврата, груп¬ 
па «указателей кадра» и локальные переменные, исполь¬ 
зуемые процедурой. Вся эта информация в общем назы¬ 
вается «стековым кадром». «Указатели кадра» представ¬ 
ляют собой указатели стековых кадров вызовов проце¬ 
дур, которые ведут к вызванной текущей процедуре. 

Из четырех компонентов стекового кадра команда 
ENTER очень удобно работает с двумя последними. Па¬ 
раметры процедуры программист явно включает в стек 
до команды CALL (которая включает в стек адрес воз¬ 
врата). Команда ENTER включает в стек указатели 
кадра (если они есть) и распределяет место в стеке для 
локальных переменных. 

Команда имеет два операнда: первый — число 
байт, резервируемых для хранения локальных перемен¬ 
ных, а второй — это уровень текущей процедуры. Уро¬ 
вень управляет тем, сколько указателей кадра включает¬ 
ся в стек (например, команда ENTER нулевого уровня 
только распределяет память для локальных переменных). 
Команда LEAVE переводит стек в то состояние, в кото¬ 
ром он был до выполнения команды ENTER. 

Выполнение команды состоит из нескольких этапов, 
текущее содержимое ВР включается в стек, ВР заменя¬ 
ется на SP, в стек включаются все указатели кадра (до 
достижения 0 уровня) и производится декремент SP на 
число байт, которое резервируется для локальных пере¬ 
менных. Эти действия можно реализовать и другими ас¬ 
семблерными командами; однако команда ENTER дейст¬ 
вует очень быстро и дает разработчикам компиляторов 
стандартный способ реализации вызовов процедур. 

В большинстве ассемблерных программ команда 
ENTER применяется с нулевым уровнем, либо совсем не 
применяется. Она делает больше операций, чем требует¬ 
ся в большинстве ассемблерных программ. Уровни боль¬ 
ше нуля предназначены для разработчиков компилято¬ 
ров. 


Особые случаи Режимы Причины 

#SS(0) Р (E)SP превысил предел стека 
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Примечания 

Команда ENTER на уровнях больше 0 становится 
довольно сложной, так как при каждом новом вызове 
процедуры необходимо повторно сохранять указатели 
всех предыдущих стековых кадров. Это организовано 
так, что каждая новая процедура может считать гло¬ 
бальными все переменные в процедуре, которая вызвала 
ее, или в процедуре, которая вызвала эту вызывающую 
процедуру и т. д. Такой способ ограниченного доступа к 
переменным является базовым для некоторых новых 
языков программирования. 

Обычно команда ENTER является первой командой 
в процедуре. Первый параметр ее — это число байт для 
хранения локальных переменных; доступ к ним осущест¬ 
вляется через ВР как индексный регистр. Старое значе¬ 
ние ВР имеет смещение 0, а за ним следуют указатели 
кадра (если они есть). Затем идут локальные перемен¬ 
ные. Второй параметр является текущим уровнем. В 
конце процедуры находится команда LEAVE, которая 
восстанавливает указатель стека и устраняет доступ к 
локальным переменным. 


Пример 


SUBROUTINE: 


ENTER 12,3 

; Подпрограмма ' имеет 3 локаль- 
; ных переменных (двойные сло- 
; ва) и находится на уровне 


; вложения 3. 

LEAVE 

; Удаляет из стека текущий сте- 
; ковый кадр. 

RET 8 

; Подпрограмма имела два пара- 
; метра (двойные слова). 
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HLT Останов (8086) 


КОП Формат Такты 

F4 HLT 5 

Флажки 



NT 

IOPL 

OF 

DF 

IF 

TF 

SF 

ZF 


AF 


PF 


CF 

0 







_ 


0 

_ 

0 


1 



Псевдокод 


WHILE нет разрешенного внешнего прерывания или 
RESET DO 
END WHILE 


Операция 

Команда HLT останавливает выполнение дальней¬ 
ших команд до восприятия внешнего прерывания или 
сброса RESET. Обычно она применяется для управления 
программами, которые должны прямо взаимодействовать 
с внешним миром (другими CPU, которые должны акти¬ 
визировать остановленный микропроцессор сигналом 
RESET, или внешними устройствами, генерирующими 
сигнал прерывания). 


Особые случаи Режимы Причины 

#GP(0) Р Текущий уровень привилегий 

не 0 
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Примечания 

В однопроцессорных компьютерах команда HLT 
применяется редко. Ее можно заменить бесконечным 
циклом ожидания прерывания (с небольшим запаздыва¬ 
нием восприятия прерывания). 


Пример 


HLT ; Процессор останавливается. 
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IDIV Знаковое деление 

( 8086 ) 

КОП Формат Такты 

F6 [7] IDIV AL,r/mb 19/22 

F7 [7] IDIV AX,r/mw 27/30 

F7 17] IDIV EAX.r/md 43/46 


Флажки 



NT 

IOPL 

OF 

DF 

IF 

TF 

SF 

ZF 


AF 


PF 


CF 

0 









0 

— 

0 


1 



Псевдокод 

IF код операции F6 THEN (*делимое слово*) 
разделить АХ на знаковый байт из операнда 
сохранить частное в AL 
сохранить остаток в АН 

ELSE IF размер операнда 16 THEN (*делимое двой¬ 
ное слово*) 

разделить DX:AX на знаковое слово из операнда 
сохранить частное в АХ 
сохранить остаток в DX 
ELSE (*делимое счетверенное слово*) 

разделить EDX:EAX на знаковое двойное слово из 
операнда 

сохранить частное в ЕАХ 
сохранить остаток в EDX 
END IF 




148 


Инструкции процессора 80386 


Операция 

Делимое и делитель считаются знаковыми числами. 
Частное и остаток в виде знаковых чисел помещаются в 
регистры. 


Особые случаи Режимы Причины 


#GP(0) 

#SS(0) 

#GP(0) 


#PF (fc) 
INT(O) 


INT(13) 


P Результат в защищенном от 

записи сегменте 

Р Неверный адрес в сегменте SS 

Р Недопустимый эффективный 

адрес памяти в сегментах CS, 
DS, ES, FS, GS 

Р V Страничное нарушение 

Р R V Результат слишком велик для 

получателя или делитель ра¬ 
вен нулю 

R V Часть операнда вне диапазона 

адреса от 0 до 0FFFFH 


Примечания 

Команда *ШІѴ выполняется несколько дольше DIV. 
Ее следует избегать в критических секциях программы. 
Так как переполнение вызывает прерывание, целесооб¬ 
разно перед операцией проверить возможность деления. 

Команда IDIV работает со знаковыми числами, поэ¬ 
тому абсолютный диапазон чисел меньше, чем в коман¬ 
де DIV. 

Часто требуется процедура деления с повторяющи¬ 
мися командами DIV или IDIV, которая обеспечивает 
большую точность, чем одна команда DIV или IDIV. 


Пример 


MOV 

MOV 

IDIV 


АХ,956 ; Загружает ЗВСН в АХ. 

ВХ,-300 ; Загружает 0FED4H в ВХ. 

АХ,ВХ ; AL= -3(0FFFDH) и АН=56. 
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IMUL Знаковое умножение 
( 8086 ) 


КОП 


Формат 

Такты 

F6 

[5] 


IMUL r/mb 

9-14/12-17 

F7 

151 


IMUL r/mw 

9-22/12-25 

F7 

[51 


IMUL r/md 

9-38/12-41 

OF AF 

[r] 

IMUL rw,r7mw 

9-22/12-25 

OF 

AF 

[r] 

IMUL rd,r/md 

9-38/12-41 

6B 

[r) 

ib 

IMUL rw,r/mw,ib 

9-14/12-17 

6B 

[r 1 

ib 

IMUL rd,r/md,ib 

9-14/12-17 

6B 

[r ] 

ib 

IMUL rw,ib 

9-14/12-17 

6B 

[r] 

ib 

IMUL rd,ib 

9-14/12-17 

69 

[r ] 

iw 

IMUL rw,r/mw,iw 

9-22/12-25 

69 

[r ] 

id 

IMUL rd,r/md,id 

9-38/12-41 

69 

[r ] 

iw 

IMUL rw,iw 

9-22/12-25 

69 

Ir ] 

id 

IMUL rd,id 

9-38/12-41 


Флажки 



NT 

IOPL 

OF 

DF 

IF 

TF 

SF 

ZF 


AF 


PF 


CF 

0 



S 




U 

U 

0 

_ 

7 

0 

U 

1 

S 


Псевдокод 

IF однооперандная форма THEN 
IF размер операнда байт THEN 

Установить АХ на произведение AL и операнда 
ELSE IF размер операнда слово THEN 

Установить DX:AX на произведение АХ и опе¬ 
ранда 

ELSE (’"размер операнда двойное слово*) 

Установить EDX:EAX на произведение ЕАХ и 
операнда 
END IF 

ELSE IF двухоперандная форма THEN 
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Установить перв'ый операнд на произведение пер¬ 
вого и второго операндов 
ELSE (*трехоперандная форма*) 

Установить первый операнд на произведение вто¬ 
рого и третьего операндов 

END IF 
Операция 

Все операнды считаются знаковыми числами; произ¬ 
ведение также будет знаковым числом. Произведение п- 
битных чисел в общем случае содержит 2п бит. Когда 
OF=l, в многооперандных формах команды произошла 
потеря старших бит результата. В однооперандных фор¬ 
мах такая ситуация исключена, так как размер резуль¬ 
тата вдвое больше размера операндов. 

Особые случаи Режимы Причины 

#GP(0) Р Недопустимый эффективный 

адрес памяти в сегментах CS, 

DS, ES, FS, GS 

#SS(0) Р Неверный адрес в сегменте SS 

#PF(fc) Р V Страничное нарушение 

INTG3) R V Часть операнда вне диапазона 

адреса от 0 до 0FFFFH 

Примечания 

Время умножения зависит от значения множителя. 
Чем больше значащих бит, тем больше длится операция. 
В 80386 используется алгоритм умножения с «досроч¬ 
ным» окончанием. Правый операнд во всех формах ко¬ 
манды IMUL называется оптимизирующим множителем 
(«т» в приводимом ниже соотношении). Фактическое 
число тактов умножения определяется следующим соот¬ 
ношением: 

IF m=0 THEN тактов=9 

ELSE TaKTOB=max(log 2(lml),3)+6 

Пример 

MOV AL,40 ; Загружает 40 в AL. 

IMUL 10 ; AX содержит 400, OF=l. 
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IN 

Ввод из 

порта 

КОП 

Формат 

Такты 

Е4 ib 

IN AL,ib 

5 

Е5 ib 

IN AX,ib 

5 

Е5 ib 

IN EAX,ib 

5 

ЕС 

IN AL,DX 

6 

ED 

IN AX,DX 

6 

ED 

IN EAX,DX 

6 

Флажки 




( 8086 ) 



NT 

IOPL 

OF 

DF 

ІІ 

TF 

SF 

ZF 




PF 


CF 

0 









0 


0 


1 



Псевдокод 

IF второй операнд непосредственный THEN 

Расширить второй операнд до 16 бит с нулем для 
получения адреса входного порта 

ELSE 

Адрес второго порта содержится в DX 
END IF 

IF размер первого операнда байт THEN 
Передать байт из входного порта в AL 
ELSE IF размер первого операнда слово THEN 
Передать слово из входного порта в АХ 
ELSE (^размер первого операнда — двойное слово*) 
Передать двойное слово из входного порта в ЕАХ 
END IF 


Операция 

Команда IN применяется для получения одного бай¬ 
та, слова или двойного слова из порта периферийного 
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устройства, номер которого от 0 до 65535. Обычно уст¬ 
ройство имеет несколько отдельных портов для команд, 
слова состояния и данных. Первые два из них применя¬ 
ются для целей управления. 

Номера портов 00F8H — 00FFH зарезервированы 

фирмой Intel и использовать их не следует. 


Особые случаи Режимы Причины 

#GP(0) Р Текущая привилегия больше 

IOPL 

#GP(0) V Некоторые из бит разрешения 

в TSS содержат 1 


Примечания 

Обычно программы осуществляют ввод путем вызова 
операционной системы, и команда IN в этом случае не 
нужна. Однако она необходима для разработчиков драй¬ 
веров устройств и для работы непосредственно с устрой¬ 
ством. 

Когда требуется ввести несколько байт, следует 
пользоваться командой IN. Если устройство ввода не мо¬ 
жет обеспечить данные с высокой скоростью, команду 
IN можно поместить в цикл и замедлять скорость пере¬ 
дачи данных командами NOP или циклом задержки. 


Пример 

MOV 


IN 


DX,20 

EAX,DX 


; Номер порта для команды IN в 
; DX. 

; Вводит двойное слово в ЕАХ. 
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INC Инкремент (8086) 


КОП 

Формат 

Такі 

FE [0] 

INC r/mb 

2/6 

FF [0] 

INC r/mw 

2/6 

FF [0] 

INC r/md 

2/6 

40+rw 

INC rw 

2 

40+rd 

INC rd 

2 


Флажки 



NT 

IOPL 

OF 

DF 

IF 

TF 

SF 

ZF 


AF 


PF 


CF 

H 

0 

l_ 



S 


— 


S 

S 

0 

S 

0 

S 

1 



Псевдокод 

Увеличить операнд на 1. 


Операция 

Команда INC прибавляет I к своему единственному 
операнду и сохраняет результат в операнде. 


Особые случаи Режимы Причины 


#GP(0) 

#GP(0) 


#SS(0) 

#PF(fc) 

INT(13) 


P Результат в защищенном от 

записи сегменте 

Р Недопустимый эффективный 

адрес памяти в сегментах CS, 
DS, ES, FS, GS 

Р Неверный адрес в сегменте SS 

Р V Страничное нарушение 

R V Часть операнда вне диапазона 

адреса от 0 до 0FFFFH 
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Примечания 

Хотя команда INC кажется гораздо проще команды 
ADD, она выполняется примерно такое же время. Ко¬ 
манда INC не влияет на флажок CF, поэтому часто 
лучше пользоваться командой ADD. 


Пример 

MOV АХ,956 ; Загружает ЗВСН в АХ. 

INC АХ ; Теперь АХ содержит 957. 
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INS Ввод циклический 
из порта (80186) 


КОП 

Формат 

Такты 

(одиночная) 

Такты 

(с повторением) 

6С 

INSB 

8 

6+6*N 

6D 

INSW 

8 

6+6*N 

6D 

INSD 

8 

6+6*N 


Значение N означает число в регистре (Е)СХ. 


Флажки 



NT 

IOPL 

OF 

DF 

IF 

TF 

SF 

ZF 


AF 


PF 


CF 

0 







_ 


0 


0 


1 



Псевдокод 

IF размер операнда байт THEN 

Передать в AL байт из входного порта с номером 
в DX 

ELSE IF размер операнда слово THEN 

Передать в АХ слово из входного порта с номе¬ 
ром в DX 

ELSE (*размер операнда двойное слово*) 

Передать в ЕАХ двойное слово из входного порта 
с номером в DX 

ENff if 
IF DF=0 THEN 

Прибавить размер операнда (в байтах) к (E)DI 
ELSE 

Вычесть размер операнда (в байтах) из (Е) DI 
END IF 
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Операция 

Команда INS, как и команда IN, применяется для 
ввода из порта периферийного устройства одного байта, 
слова или двойного слова. Номер порта от 0 до 65535. 
Обычно устройство имеет несколько отдельных портов 
для команд, слова состояния и данных. Первые два из 
них используются для управления устройством. 

В команде INS номер порта всегда находится в DX. 
Получатель данных адресуется ES: I (Е) DI ], и замена сег¬ 
мента не допускается. Команда INS рассчитана на ис¬ 
пользование с префиксом REP, т. е. в конце команды 
производится инкремент или декремент (ЕШІ (в зависи¬ 
мости от состояния DF) на размер операнда. 

Номера портов 00F8H—00FFH зарезервированы 

фирмой Intel и использовать их не следует. 


Особые случаи Режимы Причины 


#GP(0) 

#GP(0) 


#SS(0) 

#PF(fc) 

INT(13) 

#GP(0) 


P Текущая привилегия больше 

IOPL 

P Недопустимый эффективный 

адрес памяти в сегментах CS, 
DS, ES, FS, GS 

Р Неверный адрес в сегменте SS 

Р V Страничное нарушение 

R V Часть операнда вне диапазона 

адреса от 0 до 0FFFFH 
V Некоторые биты разрешения в 

TSS содержат 1 


Примечания 

Большинство программ осуществляют ввод через вы¬ 
зовы операционной системы и не используют команду 
INS, но она важна для разработки драйверов устройств 
и прямого управления устройством. 

Когда требуется ввести несколько байт, применяется 
команда INS. Если устройство не может обеспечивать 
ввод данных с высокой скоростью, команду INS можно 
поместить в цикл и уменьшать скорость передачи дан¬ 
ных с помощью команд NOP или цикла задержки. 
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Пример 


CLD 

LES EDI.INSTR 

MOV ЕСХ,5 

MOV DX,40 

REP INSB 


; Направление вперед. 

; Получатель ввода ES:[EDI]. 
; Счетчик повторения в ЕСХ. 
; Номер входного порта для 
; INS. 

; Ввести 5 байт из порта 40. 
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INT Вызов процедуры 
прерывания (8086) 

КОП Формат Такты 

СС INT 3 33* 

CD ib INT ib 37* 

CE INTO 3,35* 


*B защищенном режиме эти команды имеют другие 
функции и времена выполнения (см. гл. 5). Команда 
INTO длится три такта, если прерывания нет, и 
35 — если есть. 


Флажки 

Обычно команды INT не влияют на флажки. Одна¬ 
ко в защищенном режиме при переключении задачи из¬ 
меняются все флажки. 


Псевдокод 

IF не INTO или OF=l THEN 

Включить в стек регистр (Е) Flags 
Включить в стек регистр CS 
Включить в стек регистр (Е)ІР 
Запретить внешние прерывания (IF=0) 

Передать в CS: (Е) IP сегмент и смещение из таб¬ 
лицы векторов прерываний 

END IF 


Операция 

Прерывание похоже на вызов процедуры, но в стек 
включаются еще и флажки, и автоматически запреща¬ 
ются прерывания. Номер прерывания используется для 
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поиска элемента в таблице прерываний, который дает 
адрес процедуры обработки прерывания. 

В реальном режиме команда INT вначале включает 
в стек регистр Flags, а затем регистр сегмента кода; по¬ 
сле этого в стек включается IP. Затем сбрасывается 
флажок IF, запрещая внешние (аппаратные) прерывания. 
Наконец, из таблицы векторов прерываний в CS и IP 
загружаются сегмент и смещение. После окончания про¬ 
цедуры прерывания регистры восстанавливаются, и вы¬ 
полнение продолжается с команды, следующей после 
INT. 

Основные действия в защищенном режиме такие 
же, но необходимо пройти несколько проверок уровня 
привилегий и достаточности размера стека, в противном 
случае возникает ошибка защити (см. гл. 5). 

В команде INTO номер процедуры прерывания ра¬ 
вен 4, и прерывание возникает, если OF=l. Обычно эта 
команда применяется сразу после арифметической опера¬ 
ции. 


Особые случаи Режимы Причины 


#NP 

#TS 

#GP 

#GP 

#GP(0) 


P Заданный сегмент кода отсут¬ 

ствует 

Р Требуется переключение зада¬ 

чи 

Р Недопустимый сегмент CS, 

DS, ES, FS, GS 

Р Недопустимый сегмент SS 

R Отключение из-за недостаточ¬ 

ного стекового пространства 

V Эмулирует операцию прерыва¬ 

ния, если IOPL меньше 3 


Примечания 

Обычно таблицу векторов прерываний создает опе¬ 
рационная система, и прерывания в основном использу¬ 
ются для вызовов операционной системы. В руководстве 
по операционной системе есть инструкции по разработке 
процедур прерываний. 
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Пример 

MOV AL, 100 ; Загружает число в AL. 

MUL AL.10 ; Это умножение вызывает OF=l. 

INTO ; Возникает прерывание 4. 




_ Инструкции процессора S0386 _ НН 

IRET Возврат из 

прерывания (8086) 

КОП Формат Такты 

CF IRET 22 * 


*В защищенном режиме эта команда имеет другие фун¬ 
кции и время выполнения (см. гл. 5). 


Флажки 

Команда IRET возвращает из стека все сохраненные 
флажки. 


Псевдокод 

Извлечь из стека (Т)ІР. 
Извлечь из стека CS. 
Извлечь из стека (Е) Flags. 


Операция 

Команда IRET похожа на команду RET возврата из 
процедуры, но из стека извлекается еще и Flags. Так 
как восстанавливаются старые флажки от (предполагае¬ 
мой) команды INT или INTO, то состояние IF стано¬ 
вится прежним (заменяя запрещение прерываний от вы¬ 
полнения команды INT). 

Основные действия в защищенном режиме такие 
же, но необходимо пройти несколько проверок уровня 
привилегий и достаточности размера стека, в противном 
случае возникает ошибка защиты (см. гл. 5). 


6 Зак. 
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Особые случаи Режимы Причины 


#NP 

#TS 

#GP 

#SS 

INT(13) 

#GP(0) 


P Заданный сегмент кода отсут¬ 

ствует 

Р Требуется переключение зада¬ 

чи 

Р Неверный сегмент CS, DS, ES, 

FS, GS 

Р Неверный сегмент SS 

R Часть извлекаемого из стека 

операнда лежит ниже 0FFFFH 

V Эмулирует операцию прерыва¬ 

ния, если IOPL меньше 3 


Примечания 

Обычно таблицу векторов прерываний создает опе¬ 
рационная система, и прерывания, в основном, применя¬ 
ются для вызовов операционной системы. Команды IRET 
для этих системных вызовов находятся в конце вызовов 
и не видны программисту. В руководстве по операцион¬ 
ной системе есть указания по разработке процедур пре¬ 
рываний. 


Пример 


IRET ; Возврат из прерывания. 
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JCC Переход, 

если условие 





удовлетворяется (8086) 

коп 


Формат 

Условие перехода 

Такты 

77 

db 


JA db 

Выше (CF=0 и ZF=0) 

7+т,3 

OF 

87 

dw 

JA dw 

Выше (CF=0 и ZF=0) 

7+т,3 

OF 

87 

dd 

JA dd 

Выше (CF=0 и ZF=0) 

7+т,3 

73 

db 


JAE db 

Выше или равно (CF^)) 

7+т,3 

OF 

83 

dw 

JAE dw 

Выше или равно (CF=0) 

7+т,3 

OF 

83 

dd 

JAE dd 

Выше или равно (CF=0) 

7+!п,3 

72 

db 


JB db 

Ниже (CF=1) 

7+т,3 

OF 

82 

dw 

JB dw 

Ниже (CF=1) 

7+т,3 

OF 

82 

dd 

JB dd 

Ниже (CF=1) 

7+т,3 

76 

db 


JBE db 

Ниже или равно (CF=1 
или ZF=1) 

7+т,3 

OF 

86 

dw 

JBE dw 

Ниже или равно (CF=1 
или ZF=1) 

7+т,3 

OF 

86 

dd 

JBE dd 

Ниже или равно (CF=1 
или ZF=1) 

7+т,3 

72 

db 


JC db 

Перенос (CF=1) 

7+т,3 

OF 

82 

dw 

JC dw 

Перенос (CF=1) 

7+т,3 

OF 

82 

dd 

JC dd 

Перенос (CF=1) 

7+т,3 

E3 

db 


JCXZ db 

сх=о 

7+т,3 

74 

db 


JE db 

Равно (ZF=1) 

7+т,3 

OF 

84 

dw 

JE dw 

Равно (ZF=1) 

7+т,3 

OF 

84 

dd 

JE dd 

Равно (ZF=1) 

7+т,3 

E3 

db 


JECXZ db ECX=0 

7+т Т 3 

7F 

db 


JG db 

Больше (ZF=0 и SF=OF) 

7+т,3 

OF 

8F 

dw 

JG dw 

Больше (ZF=0 и SF=OF) 

7+т,3 

OF 

8F 

dd 

JG dd 

Больше (ZF=0 и SF=OF) 

7+т,3 

7D 

db 


JGE db 

Больше или равно 
(SF=OF) 

7+т,3 

OF 

8D 

dw 

JGE dw 

Больше или равно 
(SF=OF) 

7+т,3 

OF 

8D 

dd 

JGE dd 

Больше или равно 
(SF=OF) 

7+т,3 

7C 

db 


JL db 

Меньше (SFoOF) 

7+т,3 

OF 

8C 

dw 

JL dw 

Меньше (SFoOF) 

7+т,3 

OF 

8C 

dd 

JL dd 

Меньше (SFoOF) 

7+т,3 


6* 
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7Е db JLE db Меньше или равно (ZF=1 7+m,3 

или SF<>OF) 

OF 8E dw JLE dw Меньше или равно (ZF=1 7+m,3 

или SF<>OF) 

OF 8E dd JLE dd Меньше или равно (ZF-1 7+m,3 

или SFoOF) 


76 

db 


JNA db 

He выше (CF=1 или ZF+1) 

7+т,3 

OF 

86 

dw 

JNA dw 

He выше (CF=1 или ZF=1) 

7+т,3 

OF 

86 

dd 

JNA dd 

He выше (CF=1 или ZF=1) 

7+т,3 

72 

db 


JNAE db 

He выше или равно (CF=1) 7+m,3 

OF 

82 

dw 

JNAE dw 

He выше или равно (CF=1) 7+m,3 

OF 

82 

dd 

JNAE dd 

He выше или равно (CF=l)7+m,3 

73 

db 


JNB db 

He ниже (CF=0) 

7+т,3 

OF 

83 

dw 

JNB dw 

He ниже (CF=0) 

7+т,3 

OF 

83 

dd 

JNB dd 

He ниже (CF=0') 

7+т,3 

77 

db 


JNBE db 

He ниже или равно (CF=0 
и ZF=0) 

7+т,3 

OF 

87 

dw 

JNBE dw 

He ниже или равно (CF4) 
и ZF=0) 

7+т,3 

OF 

87 

dd 

JNBE dd 

Не ниже или равно (CF=*0 
и ZF=0) 

7+т,3 

73 

db 


JNC db 

Не перенос (CF=0) 

7+т,3 

OF 

83 

dw 

JNC dw 

Не перенос (CF=0) 

7+т,3 

OF 

83 

dd 

JNC dd 

Не перенос (CF=0) 

7+т,3 

75 

db 


JNE db 

Не равно (ZF=0) 

7+га,3 

OF 

85 

dw 

JNE dw 

Не равно (ZF=0) 

7+т,3 

OF 

85 

dd 

JNE dd 

Не равно (ZF=0) 

7+т,3 

7E 

db 


JNG db 

Не больше (ZF=1 или 
SF<>OF) 

7+ш,3 

OF 

8E 

dw 

JNG dw 

Не больше (ZF=1 или 
SFoOF) 

7+т,3 

OF 

8E 

dd 

JNG dd 

Не больше (ZF=1 или 
SFoOF) 

7+т,3 

7C 

db 


JNGE db 

Не больше или равно 
(SFoOF) 

7+т,3 

OF 

8C 

dw 

JNGE dw 

Не больше или равно 
(SFoOF) 

7+т,3 

OF 

8C 

dd 

JNGE dd 

Не больше или равно 
(SFoOF) 

7+т,3 

7D 

db 


JNL db 

Не меньше (SF=OF) 

7+т,3 

OF 

8D 

db 

JNL dw 

Не меньше (SF=OF) 

7+т,3 

OF 

8D 

dd 

JNL dd 

Не меньше (SF=OF) 

7+т,3 

7F 

db 


JNLE db 

Не меньше или равно 

7+т,3 


(ZF=0 и SF-OF) 
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OF 

8F 

dw 

JNLE dw 

He меньше или равно 
(ZF-0 и SF-OF) 

7+m,3 

OF 

8F 

dd 

JNLE dd 

He меньше или равно 
(ZF=0 и SF=OF) 

7+m,3 

71 

db 


JNO db 

Не переполнение (OF=0) 

7+m,3 

OF 

81 

dw 

JNO dw 

Не переполнение (0F-0) 

7+m,3 

OF 

81 

dd 

JNO dd 

Не переполнение (OF-0) 

7+m,3 

7B 

db 


JNP db 

Не паритет (PF=0) 

7+m,3 

OF 

8B 

dw 

JNP dw 

Не паритет (PF=0) 

7+m,3 

OF 

8B 

dd 

JNP dd 

Не паритет (PF=0) 

7+m,3 

79 

db 


JNS db 

Не знак (SF*=0) 

7+m,3 

OF 

89 

dw 

JNS dw 

Не знак (SF-0) 

7+m,3 

OF 

89 

dd 

JNS dd 

Не знак (SF=0) 

7+m,3 

75 db 


JNZ db 

Не нуль (ZF=0) 

7+m,3 

OF 

85 

dw 

JNZ dw 

Не нуль (ZF=0) 

7+m,3 

OF 

85 

dd 

JNZ dd 

Не нуль (ZF=0) 

7+m,3 

70 

db 


JO db 

Переполнение (OF=l) 

7+m,3 

OF 

80 

dw 

JO dw 

Переполнение (OF=l) 

7+m,3 

OF 

80 

dd 

JO dd 

Переполнение (OF=l) 

7+m,3 

7A 

db 


JP db 

Паритет (PF-1) 

7+m,3 

OF 

8A 

dw 

JP dw 

Паритет (PF=1) 

7+m,3 

OF 

8A 

dd 

JP dd 

Паритет (PF=1) 

7+m,3 

7A 

db 


JPE db 

Паритет четный (PF-1) 

7+m,3 

OF 

8A 

dw 

JPE dw 

Паритет четный (PF=1) 

7+m,3 

OF 

8A 

dd 

JPE dd 

Паритет четный (PF=1) 

7+m,3 

7B 

db 


JPO db 

Паритет нечетный (PF=0) 

7+m,3 

OF 

8B 

dw 

JPO *dw 

Паритет нечетный (PF-0) 

7+m,3 

OF 

8B 

dd 

JPO dd 

Паритет нечетный (PF— 0) 

7+m,3 

78 

db 


JS db 

Знак (SF-1) 

7+m,3 

OF 

88 

dw 

JS dw 

Знак (SF-1) 

7+m,3 

OF 

88 

dd 

JS dd 

Знак (SF-1) 

7+m,3 

74 

db 


JZ db 

Нуль (ZF=1) 

7+m,3 

OF 

84 

dw 

JZ dw 

Нуль (ZF=1) 

7+m,3 

OF 

84 

dd 

JZ dd 

Нуль (ZF=1) 

7+m,3 


Флажки 



NT 

IOPL 

OF 

DF 

- 

TF 

5 

ZF 


AF 


PF 


CF 

0 









0 


0 


1 
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Псевдокод 

IF условие удовлетворяется THEN 

Установить IP на ІР+смещение с расширением 
знака 

END IF 
Операция 

Команды перехода изменяют последовательность вы¬ 
полнения команд. Условный переход выполняется или не 
выполняется в зависимости от состояния процессора. Пе¬ 
реходы классифицируются по способам вычисления адре¬ 
са перехода. 

В процессоре 80386 есть три типа переходов — ко¬ 
роткие, близкие и длинные. Короткие переходы — это 
относительные переходы вблизи команды перехода (от 
-128 до +127 байт). Близкие переходы тоже относитель¬ 
ные, но передают управление в пределах всего сегмента 
кода. Длинные переходы — это абсолютные переходы по 
конкретному адресу в любом сегменте кода. В 80386 ус¬ 
ловные переходы — короткие или близкие, а для ко¬ 
манд JCXZ и JECXZ — только короткие. 

Большинство команд условных переходов проверяют 
состояние одного или нескольких флажков. Если условие 
удовлетворяется, переход производится; в противном слу¬ 
чае выполняется следующая по порядку команда. Коман¬ 
ды JCXZ и JECXZ проверяют не флажки, а содержимое 
регистра СХ или ЕСХ. 

Первое значение для времени выполнения соответст¬ 
вует выполнению перехода, а второе — случаю, когда 
перехода нет. Переходы замедляют работу процессора 
80386, так как очереди команд очищаются и их нужно 
повторно заполнять. Значение «т» — это число компо¬ 
нентов в команде по адресу перехода. Компонентом счи¬ 
тается каждый байт префикса, байт кода операции, байт 
ModRM и байт SIB. Смещение или непосредственное 
значение также учитывается. 


Особые случаи Режимы Причины 

#GP(0) Р Переход вне границ сегмента 

кода 
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Примечания 

Часть команд условного перехода предназначена для 
беззнаковых чисел, а другая — для знаковых. Слова 
«выше» и «ниже» относятся к беззнаковым числам, а 
«больше» и «меньше» — к знаковым. 

Из таблицы видно, что для нескольких мнемоник 
имеет место один и тот же код операции. Причина та¬ 
кой избыточности в том, что одно и тоже состояние 
флажков^ может иметь разный смысл в зависимости от 
контекста перехода. Обычно условный переход применя¬ 
ется после команд СМР и SUB. Он учитывает результат 
сравнения, и к нему подходит мнемоника JE (перейти, 
если равны). С другой стороны, после команды DEC тот 
же переход удобно обозначить мнемоникой JZ (перейти, 
если нуль), оканчивая цикл при достижении счетчиком 
нуля. 

Команды JCXZ и JECXZ реализуют короткие пере¬ 
ходы. Для реализации длинных переходов потребуется 
дополнительная команда JMP. 

Команды REPE и LOOPNE вызывают зацикливание 
по состоянию ZF или СХ=0. Команда LCXZ сразу после 
цикла вызывает переход, когда окончание цикла вызва¬ 
но достижением СХ нуля. Это позволяет отдельно обра¬ 
батывать различные условия окончания цикла. 


Пример 


MOV 

ЕСХ,5 

Операнд для сравне¬ 
ния. 

СМР 

ЕСХ,7 

Сравнить 5 и 7. 

JLE 

TARGET 

Переход будет, 10 



тактов. 

TARGET: AND 

AL,7 

3 компонента: КОП, 
ModRM и непосредст¬ 
венное значение. 
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JMP Безусловный переход 
( 8086 ) 


КОП Формат Тип Такты 


ЕВ 

db 

JMP db 

Короткий, прямой 

7+т 

Е9 

dw 

JMP dw 

Короткий, прямой 

7+т 

Е9 

dd 

JMP dd 

Короткий, прямой 

7+т 

FF 

И] 

JMP r/mw 

Короткий, косвенный 

7+т/ 10+т 

FF 

[4] 

JMP r/md 

Короткий, косвенный 

7+т/10+т 

ЕА pd 

JMP pd 

Длинный, прямой 

17+т* 

ЕА 

РР 

JMP pp 

Длинный, прямой 

17+т* 

FF 

[5] 

JMP mw:w 

Длинный, косвенный 

22+т* 

FF 

[5] 

JMP mw:d 

Длинный, косвенный 

22+т* 


*В защищенном режиме эти команды имеют другие 
функцию и время выполнения. 


Флажки 

Обычно команда JMP не воздействует на флажки, 
но в защищенном режиме при переключении задачи все 
флажки модифицируются (см. гл. 5). 


Псевдокод 

IF межсегментный переход THEN 

Установить CS на селектор сегмента операнда 
END IF 

Установить IP на смещение операнда 


Операция 

Команда JMP передает управление безусловно, т. е. 
переход осуществляется всегда (оператор GOTO в язы¬ 
ках высокого уровня). Все команды перехода замедляют 
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работу процессора 80386, так как очередь команд очи¬ 
щается и должна заполняться вновь. 

Имеется 5 типов команд перехода в зависимости от 
того, где находится точка перехода и как определяется 
адрес перехода. 

В коротком (прямом) переходе эта точка определя¬ 
ется смещением, находящимся сразу за кодом операции. 
Это смещение просто прибавляется к IP, давая новый 
адрес. Длина смещения — один байт, поэтому диапазон 
перехода от -128 до +127 байт. 

Короткий прямой переход может содержать отно¬ 
сительное смещение, находящееся за кодом опе¬ 
рации, и оно также прибавляется к JP. От¬ 
метим, что во время суммирования IP показывает на 
команду после JMP. Длина смещения — слово 
или двойное слово в зависимости от текущего сегмента 
кода. 

В близком косвенном переходе определяется регистр 
или ячейка памяти, содержащие смещение нужной ко¬ 
манды в текущем сегменте кода. Длина смещения также 
является словом или двойным словом в зависимости от 
размера текущего сегмента кода. 

Длинный прямой переход допускает передачу управ¬ 
ления в другой сегмент кода. Команда содержит непос¬ 
редственный операнд, являющийся указателем следую¬ 
щей выполняемой команды. Указатель состоит из слова 
селектора сегмента (он загружается в CS) и смещения в 
виде слова или двойного слова, которое загружается в 
(Е) IP. Размер смещения зависит от размера сегмента 
кода. 

Длинный косвенный переход аналогичен коротко¬ 
му косвенному переходу в том, что команда содержит 
указатель фактического адреса. Но этот адрес является 
полным указателем, а не только смещением, поэ¬ 
тому он не может быть в регистре. Указатель содержит 
селектор сегмента (он загружается в CS) и слово 
или двойное слово смещения, которое загружает 
ся в (Е)ІР. Размер смещения зависит от размера сег¬ 
мента кода. 

В защищенном режиме основные действия 
такие же, но межсегментные переходы сложнее, так 
как переход может определять процедуру опера¬ 
ционной системы или даже другую задачу. В этих 
случаях необходимо контролировать защиту памяти (см. 
гл. 5 ). 
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Особые случаи Режимы Причины 


#NP 

#TS 

#GP(0) 


#SS(0) 
#PF (fc) 
INT(13) 


P Заданный сегмент кода отсут¬ 

ствует 

Р Требуется переключение зада¬ 

чи 

Р Недопустимый эффективный 

адрес памяти в сегментах CS, 
DS, ES, FS, GS 

Р Неверный адрес в сегменте SS 

Р V Страничное нарушение 

R V Часть операнда вне диапазона 

адреса от 0 до 0FFFFH 


Примечания 

В процессоре 80386 короткий переход (расстояние в 
байт) и короткий прямой переход (расстояние в слово) 
в реальном режиме длятся 7 тактов. Достоинство корот¬ 
кого перехода только в том, что команда короче на 
один байт. 


Пример 


JMP TARGET 
TARGET: AND АХ,7 


Переход длится 10 так¬ 
тов. 

3 компонента (КОП, 
ModRM и непосредст¬ 
венный байт). 




Инструкции процес 


LAHF Загрузка флажков в 
АН (8086) 

КОП Формат Такты 

9F LAHF 2 


Флажки 



NT 

IOPL 

OF 

DF 

IF 

TF 

SF 

ZF 


AF 


PF 


CF 

3 




J 



L 


0 


0 

_ 

1 



Псевдокод 

Установить АН на младший байт регистра Flags. 


Операция 

Позволяет передать флажки в регистр АН, где их 
можно обработать. Команда введена для совместимости с 
8080/85 и применяется редко. 

Биты в АН: SF ZF х AF х PF х CF. 


Особые случаи 
Нет. 


Примечания 

Команда LAHF применяется редко. Но ее можно 
использовать для проверки всего байта флажков (напри¬ 
мер, сравнивая АН с маской) или для реализации слож- 
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ных переходов, не реализуемых обычными командами 
JE, JNA и другими. Нужно учитывать, что при этом 
несколько бит не определены. Команда AND AH,D5H 
позволяет сбросить неопределенные биты. 


Пример 


; Загружает флажки в АН. 

; Маскирует биты AF и CF. 

; Имитирует переход по 
; «AF=CF=1». 


LAHF 

AND АН,11Н 
JNZ SOMEWHERE 
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LEA Загрузка смещения 
эффективного адреса 
( 8086 ) 


КОП 

Формат 

Такты 

8D [г] 

LEA rl6,ml6 

2 

8D [г] 

LEA r32,ml6 

2 

8D [г] 

LEA rl6,m32 

2 

8D [г] 

LEA г32,ш32 

2 

Флажки 





NT 

IOPL 

OF 

DF 

3 

TF 

SF 

ZF 


AF 


PF 

, 

CF 

0 








H 

0 


0 





Псевдокод 

IF размер регистра 16 THEN 
IF размер памяти 16 THEN 

Установить регистр на смещение эффективного 
адреса 

ELSE (*размер памяти 32*) 

Установить регистр на младшие 16 бит смеще¬ 
ния эффективного адреса 
END IF 

ELSE (*размер регистра 32*) 

IF размер памяти 16 THEN 

Установить регистр на смещение эффективного 
адреса с нулевым расширением до 32 бит 
ELSE (*размер памяти 32*) 

Установить регистр на смещение эффективного 
адреса 
END IF 

END IF 
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Операция 

Команда LEA похожа на команду MOV, пересылаю¬ 
щую данные из памяти в регистр, но при этом переда¬ 
ется смещение адреса, а не содержимое RAM по этому 
адресу. Размер памяти в псевдокоде определяется атри¬ 
бутом USE сегмента, содержащего адрес памяти. 


Особые случаи Режимы Причины 

#UD Р Второй операнд регистр 

INT(6) R V Второй операнд регистр 


Примечания 

Иногда команды LEA и MOV могут взаимозаме- 
няться, например LEA AX,STRUC и MOV АХ, OFFSET 
STRUC. Однако команда LEA позволяет использовать 
для второго операнда любой режим адресации памяти. 
Например, команда LEA AX,STRUC|BX )[ D 1 ] позволяет 
передать в АХ адрес указателя с двойной адресацией; 
командой MOV этого сделать нельзя. 

Команда LEA имеет ограниченные возможности по 
умножению. В режиме масштабированной индексной ад¬ 
ресации можно реализовать умножение на 2, 4, 8. В 
режиме базовой масштабированной индексной адресации 
можно умножить на 3 и 9. Все это занимает всего 2 
такта. 


Пример 


MOV 

LEA 


ВХ, 11 ; Для умножения в ВХ. 

АХ,[ВХ][ВХх4] ; В АХ будет ВХх5=55. 
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LEAVE Удаление стекового 
кадра процедуры 
( 80186 ) 


КОП 

Формат 

Такты 

С9 

LEAVE 

4 

Флажки 





NT 

IOPL 

OF 

DF 

IF 

TF 

SF 

ZF 


AF 


PF 


CF 

0 









0 


0 


1 



Псевдокод 

Установить (E)SP на (Е)ВР. 

Извлечь из стека старый указатель кадра в (Е)ВР. 


Операция 

Команда LEAVE применяется для реализации вызо¬ 
вов процедур и ориентирована на языки высокого уров¬ 
ня. Она сбрасывает указатель стека для удаления ло¬ 
кальных переменных процедуры и извлекает из стека 
«указатель кадра». Эти действия готовят стек к следую¬ 
щей команде RET. 


Особые случаи Режимы Причины 

#SS(0) Р ВР адресует ячейку вне теку¬ 

щего сегмента стека 

INT(13) R V Часть операнда вне диапазона 

адреса от 0 до 0FFFFH 
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Примечания 

Команда LEAVE гораздо проще команды ENTER, 
выполняющей основную работу. Она устанавливает ВР 
на адресацию правильного места, поэтому LEAVE долж¬ 
на просто поместить ВР в указатель стека, а затем из¬ 
влечь из стека старое значение ВР. 

Команда LEAVE должна быть лоследней командой 
перед RET в процедуре, имеющей первую команду 
ENTER. Команда LEAVE изменяет указатель стека так, 
что все локальные переменные удаляются из стека, а 
указатель кадра ВР готов для процедуры, • которая вызы¬ 
вала данную. 


Пример 

SUBROUTINE: 

ENTER 12,3 


LEAVE 
RET 8 


Подпрограмма имеет 3 
локальных перемен¬ 
ных (двойные слова) 
и находится на уров¬ 
не выполнения 3. 

Удаляет из стека те¬ 
кущий стековый кадр. 
Подпрограмма имеет 2 
параметра (двойные 
слова) 
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LOCK Формирование 

сигнала блокировки 
шины ( 8086 ) 

КОП Формат Такты 

F0 LOCK 0 


Флажки 



NT 

IOPL 

OF 

DF 

IF 

TF 

SF 

ZF 


AF 


PF 


CF 

0 









0 


o 


1 



Псевдокод 

Формировать сигнал блокировки шины на время вы¬ 
полнения следующей команды. 


Операция 

Префикс LOCK применяется в мультипроцессорных 
системах для предотвращения конфликтов при обращени¬ 
ях к разделенной памяти. Сигнал LOCK запрещает до¬ 
ступ к шине других устройств, подключенных к шине. 
Сигнал действует все время выполнения команды, нахо¬ 
дящейся за префиксом LOCK. 

В процессоре 80386 с префиксом LOCK могут ис¬ 
пользоваться не все команды. Указание его перед нераз¬ 
решенной командой вызывает особое прерывание неопре¬ 
деленного кода операции. Разрешены следующие коман¬ 
ды: 


ВТ, BTS, BTR, BTC mem, reg/imm 

ADD, OR, ADC, SBB, AND, SUB, XOR mem, reg/imm 
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XCHG reg, mem 

XCHG mem, reg 

NOT, NEG, INC, DEC mem 

Отметим, что все эти команды требуют считывания 
операнда из памяти, его модификации и записи в ту же 
ячейку памяти. Команда XCHG блокируется всегда, да¬ 
же без указания префикса. 


Особые случаи 

Режимы 

Причины 

#GP(0) 

Р 

Текущий уровень привилегий 
больше уровня привилегий 

ввода/вывода 

#UD 

Р V 

Команда после LOCK отсутст¬ 
вует в приведенном перечне 

INT(6) 

R 

Команда после LOCK отсутст¬ 
вует в приведенном перечне 


Примечания 

Заблокированная команда может вызвать любой до¬ 
полнительный особый случай прерывания, как при 
«обычном» выполнении. 

Необходимость префикса LOCK показывает такой 
пример. В двухпроцессорной системе ячейка разделенной 
памяти используется как счетчик «событий». Когда лю¬ 
бой из процессоров обнаруживает событие, он должен 
произвести инкремент этого счетчика. Предположим, что 
команда INC в программе каждого процессора не имеет 
префикса LOCK. Пусть зафиксированно 4 события и оба 
процессора одновременно обнаруживают событие. Если 
оба процессора попытаются выполнить свои команды 
INC в одно время, возникает следующая ситуация. 

Первый процессор считывает из памяти значение 
(4) и начинает внутренний инкремент. В этот момент 
второй процессор получает шину и считывает из памяти 
то же значение (4). Пока второй процессор производит 
инкремент, первый возвращает в память результат (5). 
Наконец, второй процессор также записывает в память 
свой результат (5). В этом случае одно «событие» про¬ 
пущено. Префикс LOCK предотврашает такую ошибку. 
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Вы можете заметить, что приведенная ситуация возни¬ 
кает очень редко. Конечно, система может недели и ме¬ 
сяцы работать правильно, а затем возникнет «катастро¬ 
фа». 

Блокированный доступ не гарантируется, если дру¬ 
гой процессор выполняет команду со следующими усло¬ 
виями: 

• Префикс LOCK не используется. 

• Команда не содержится в приведенном выше перечне. 

• Указанный операнд в памяти не перекрывается. 

В предыдущих процессорах іАРХ 86 допускалось бо¬ 
лее свободное использование префикса LOCK. Поэтому 
будьте внимательны при использовании программ для 
этих процессоров. 


Пример 

LOCK BTR FLAGWORD,AVAILBIT ; Очищает бит 

; доступности, 

; открывая до- 

; ступ к разде- 

; ленному ре- 

; сурсу. 

INC NODICE ; Перейти, ес- 

; ли ресурс 

; распределен. 
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LODS Загрузка массива 
( 8086 ) 


КОП 

Формат 

Такты 

(одиночная) 

Такты 

(с повторением) 

АС 

LODSB 

5 

* 

AD 

LODSW 

5 

* 

AD 

LODSD 

5 

♦ 


•Команда LODS не может использовать префиксы повто¬ 
рения. 


Флажки 



NT 

IOPL 

OF 

DF 

- 

TF 

SF 

ZF 


ЛР 


PF 


CF 

0 



_ 






0 


0 


1 



Псевдокод 

Определить размер операнда 
IF размер операнда 8 THEN 

Переслать в AL байт из адреса DS:[(E)SI] 

ELSE IF размер операнда 16 THEN 

Переслать в АХ слово из адреса DS: I (E)SI 1 
ELSE (‘размер операнда 32*) 

Переслать в ЕАХ двойное слово из адреса 
DS:[(E)SI ] 

IF DF=0 THEN 
END IF 

Прибавить к (E)SI размер операнда (в байтах) 
ELSE 

Вычесть из (E)SI размер операнда (в байтах) 

END IF 
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Операция 

Команда LODS похожа на команду MOV передачи 
из памяти в AL или АХ, но она после передачи авто¬ 
матически корректирует SI в зависимости от флажка 
DF. Коррекция производится на размер операнда. 


Особые случаи Режимы Причины 


#GP(0) 

P 

Недопустимый эффективный 

адрес памяти в сегментах CS, 
DS, ES, FS, GS 

#SS(0) 

P 

Неверный адрес в сегменте SS 

#PF(f) 

P V 

Страничное нарушение 

INK 13) 

R V 

Часть операнда вне диапазона 
адреса от 0 до 0FFFFH 

Примечания 

Команду 

LODS 

нельзя использовать с префиксами 


повторения, но она часто применяется в циклах для по¬ 
иска нужного символа в массиве: LODS загружает сим¬ 
вол в AL, он сравнивается с нужным символом, и все 
повторяется до обнаружения нужного символа. 

Команды LODS и STOS можно использовать для 
передачи массива из DS в ES, производя проверки или 
изменения. 


Пример 


Следующий фрагмент копирует массив из одно¬ 
го места в другое. Операция продолжается до пе¬ 
редачи максимального числа символа или встречи 
первого символа. 

Такие массивы применяются в языке Си. 

CLD ; Направление 

; вперед. 

LDS ESI,SSTR ; Указатель 

; источника в 
; DS: [ESI ]. 
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LES EDI,DSTR 
MOV ECX.MAXSTR 

COPYL: 

LODSB 

STOSB 

TEST AL,AL 
LOOPNZ COPYL 


; Указатель no- 
; лучателя в 
; ES:[EDI ]. 

; Счетчик повто- 
; рения цикла. 

; Символ из ис- 
; точника. 

; Передать в по- 
; лучатель. 

; Проверить ну- 
; левой символ. 

; Повторение пе- 
; редачи. 
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LOOPcc Управление 

циклом ( 8086 ) 


КОП 

Формат 

Условие перехода 

Такты 

Е2 db 

LOOP db 

(E)CX<X) 


11+m 

El db 

LOOPE db 

(Е)СХ<>0 и 

ZF=1 

ll+m 

El db 

LOOPZ db 

(E)CX<X) и 

ZF=1 

11+m 

E0 db 

LOOPNE db 

(Е)СХ<>0 и 

ZF=0 

11+m 

E0 db 

LOOPNZ db 

(E)CX<X) и 

ZF=0 

11+m 


Флажки 



NT 

IOPL 

OF 

DF 

IF 

TF 

SF 

ZF 


AF 


PF 


CF 

0 









0 


0 


1 



Псевдокод 

Декремент (Е)СХ (*флажки не применяются*) 
Определить размер операнда 
IF условие удовлетворяется THEN 

Установить IP на IP+ смещение со знаковым рас¬ 
ширением 

END IF 
Операция 

Команда LOOP производит декремент (Е)СХ и про¬ 
веряет условие достижения нуля. Может проверяться 
также ZF. Если регистр не содержит нуля и удовлетво¬ 
ряется дополнительное условие по флажку ZF, произво¬ 
дится короткий переход к метке, указанной как операнд 
после LOOPcc. Смещение имеет длину один байт и 
обеспечивает диапазон перехода от -128 до +127. Оно 
добавляется к текущему адресу, и получается адрес сле¬ 
дующей команды. 
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Особые случаи Режимы Причины 

#GP(0) Р Точка перехода вне пределов 

текущего сегмента кода 


Примечания 

Команда LOOP позволяет реализовать на ассемблере 
циклы типа FOR. Значение в СХ не должны модифици¬ 
роваться внутренними командами цикла. Счетчик цикла 
считается беззнаковым целым числом. 

Мнемоника LOOPZ часто вводит в заблуждение. 
Помните, что команда зацикливает до ZF=0 и (Е)СХ=€. 


Пример 

См. команду LODS. 
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Lxx 

Загрузка 

полного 


указателя 

(8086) 

коп 

Формат 

Такты 

С5 [г] 

LDS rw,mw:w 

7,22* 

С5 [г] 

LDS rd,mw:d 

7,22* 

С4 [г] 

LES rw,mw:w 

7,22* 

С4 [г1 

LES rd,mw:d 

7,22* 

OF В2 [г 1 

LSS rw,mw:w 

1 , 22 * 

OF В2 [г] 

LSS rd,mw:d 

7,22* 

OF В4 |г ] 

LFS rw,mw:w 

7,22* 

OF В4 [г] 

LFS rd,mw:d 

7,22* 

OF В5 [г] 

LGS rw,mw:w 

7,22* 

OF В5 [г 1 

LGS rd,mw:d 

7,22* 


*В защищенном режиме требуются дополнительные так¬ 
ты из-за необходимости дополнительной обработки. 


Флажки 



NT 

IOPL 

OF 

DF 

IF 

TF 

SF 

ZF 


AF 


PF 


CF 

0 









0 


0 


1 



Псевдокод 

Установить сегментный регистр на регистр второго 
операнда. 

Установить общий регистр на смещение второго опе¬ 
ранда. 


Операция 

Эти команды применяются для одновременной уста¬ 
новки двух регистров: сегментного регистра и регистра 
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общего назначения. В сегментный регистр загружается 
16-битный селектор сегмента операнда. В регистр общего 
назначения загружается слово или двойное слово смеще¬ 
ния второго операнда внутри сегмента. Размер зависит 
от атрибута размера указанного сегмента. 

В защищенном режиме операция сложнее. Любое 
изменение регистров означает, что процессор попытается 
обратиться совсем к другой области памяти, имеющей, 
возможно, другие уровни защиты, чем текущая. При ра¬ 
боте с виртуальной памятью сегмент даже может нахо¬ 
диться на диске. 


Особые случаи Режимы Причины 


#UD 

#GP(0) 


#GP(0) 

#SS(0) 

#PF(fc) 

INT(13) 

INT(6) 


P Источником является регистр 

P Недопустимый эффективный 

адрес памяти в сегментах CS, 
DS, ES, FS, GS 

Р В SS защищается пустой селе¬ 
ктор — 

Р Неверный адрес в сегменте SS 

Р V Страничное нарушение 

R V Часть операнда вне диапазона 

адреса от 0 до 0FFFFH 
R V Источником является регистр 


Примечания 

Эти команды, в основном, применяются для задания 
сегментного регистра и индексного регистра в подготовке 
обращения к новому блоку памяти. 


Пример 

LES DI,STRUCTURE ; Загрузить сегмент STRUC 
; в ES и смещение STRUC 
; в DI. 
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МОУ Пересылка данных 
( 8086 ) 


КОП 

Формат 

Такты 

В0+г ib 

MOV rb,ib 

2 

B8+r iw 

MOV rw,iw 

2 

B8+r id 

MOV rd,id 

2 

С6 [0] ib 

MOV r/mb,ib 

2 

С7 [0] iw 

MOV r/mw,iw 

2 

С7 [0] id 

MOV r/md,id 

2 

АО d 

MOV AL,db 

4 

A1 d 

MOV AX,dw 

4 

A1 d 

MOV EAX.dd 

4 

A2 d 

MOV db,AL 

2 

A3 d 

MOV dw,AX 

2 

A3 d 

MOV dd.EAX 

MOV r/mb.rb 

2 

88 [r 1 

2 

89 [r] 

MOV r/mw,rw 

2 

89 [r] 

MOV r/md,rd 

2 

8A [r] 

MOV rb,r/mb 

2/4 

8B [r 1 

MOV rw,r/mw 

2/4 

8B [r 1 

MOV rd,r/md 

2/4 

8E [0] 

MOV ES,r/mw 

2 / 5 * 

8E [1] 

MOV CS,r/mw 

2 / 5 * 

8E [2] 

MOV SS,r/mw 

2 / 5 * 

8E [3] 

MOV DS,r/mw 

2 / 5 * 

8C [0] 

MOV r/mw,ES 

2 

8C [1] 

MOV r/mw,CS 

2 

8C [2] 

MOV r/mw,SS 

2 

8C [3] 

MOV r/mw,DS 

2 


*В защищенном режиме эти команды требуют 18/19 
тактов из-за дополнительной обработки (см. гл. 5). 


Флажки 



NT 

IOPL 

OF 

DF 

IF 

TF 

SF 

ZF 


AF 


PF 


CF 

0 









0 


0 


Г 
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Псевдокод 

Устанавливает значение первого операнда в соответ¬ 
ствии со значением второго операнда. 

Операция 

Команда MOV похожа на оператор присвоения в 
языках высокого уровня. Первым задается операнд-полу¬ 
чатель, а вторым — источник. 

В команде MOV есть две особенности. Первая свя¬ 
зана с выполнением команды MOV SS; при этом авто¬ 
матически запрещаются все прерывания до завершения 
следующей команды. Это сделано в предположении, что 
следующей будет команда MOV SP или' другая команда, 
восстанавливающая содержимое SS:SP. 

Вторая особенность связана с передачей данных в 
любой сегментный регистр в защищенном режиме. При 
любом применении сегментного регистра процессор мо¬ 
жет обратиться к другой области памяти, которая может 
иметь другие уровни защиты. 

Особые случаи Режимы Причины 

#GP,#SS,#NP Р Загружается сегментный 

регистр 

#GP(0) Р Результат в защищенном от 

записи сегменте 

#GP(0) Р Недопустимый эффективный 

адрес памяти в сегментах CS, 
DS, ES, FS, GS 

#SS(0) Р Неверный адрес в сегменте SS 

#PF(fc) Р V Страничное нарушение 

INT(13) R V Часть операнда вне диапазона 

адреса от 0 до 0FFFFH 

Примечания 

Необходимо знать, какие команды могут заменять 
команду MOV. Например, для пересылки массивов луч¬ 
ше пользоваться командой MOVS. 

Пример 


MOV AX,ES ; Копирует содержимое ES в АХ. 
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МОѴхХ Пересылка с 

нулевым/ знаковым 
расширением 
( 8086 ) 


КОП 


Формат 

Такты 

0F 

BE 

[r ] 

MOVSX rw,r/mb 

3/6 

OF 

BE 

[r 1 

MOVSX rd,r/mb 

3/6 

OF 

BF 

[r] 

MOVSX rd,r/mw 

3/6 

OF 

B6 

[r ] 

MOVZX rw,r/mb 

3/6 

OF 

B6 

[r] 

MOVZX rd,r/mb 

3/6 

OF 

B7 

[r ] 

MOVZX rd,r/mw 

3/6 

Флажки 





NT 

IOPL 

OF 

DF 

IF 

TF 

SF 

ZF 


AF 


PF 


CF 

0 









0 


0 


Г 



Псевдокод 

Расширить источник (нулями или битом знака) до 
длины получателя. 

Сократить результат в получателе. 


Операция 

Команды MOVSX и MOVZX связаны с ситуацией, 
когда получатель имеет больше бит, чем источник (на¬ 
пример, получатель — слово, а источник — байт). SX 
означает «знаковое расширение», а ZX — «нулевое рас¬ 
ширение». 
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Особые случаи Режимы Причины 


#GP(0) 


#SS(0) 
#PF(fc) 
INT (13) 


P Недопустимый эффективный 

адрес памяти в сегментах CS, 

DS, ES, FS, GS 

Р Неверный адрес в сегменте SS 

Р V Страничное нарушение 

R V Часть операнда вне диапазона 

адреса от 0 до 0FFFFH 


Примечания 

Так как получателем в этих командах может быть 
только один из регистров, они удобны для подготовки 
регистров к дальнейшей обработке. 


Пример 


MOVSX АХ.92Н ; В АХ будет 0FF92H. 
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MOYS Пересылка цепочки 
( 8086 ) 

КОП Формат Такты Такты 

(одиночная) (с повторением) 

А4 MOVSB 7 5+4* N 

А7 MOVSW 7 5+4*N 

А7 MOVSD 7 5+4xN 

Буква N означает число повторений из регистра (Е)СХ. 


Флажки 



NT 

IOPL 

OF 

DF 

IF 

TF 

SF 

ZF 


AF 


PF 


CF 

0 

□ 







__ 

0 


0 

□ 

1 

u 


Псевдокод 

Определить размер операнда 
IF размер операнда 8 THEN 

Переслать байт из адреса DS:[(E)SI] в 

ES: [ (Е) DI ] 

ELSE IF размер операнда 16 THEN 

Переслать слово из адреса DS:[(E)SI] в 

ES: [ (Е) DI ] 

ELSE ('размер операнда 32*) 

Переслать двойное слово из адреса DS:[(E)SI] в 
ES: [ (Е) DI ] 

END IF 

IF DF=0 THEN 

Прибавить размер операнда (в байтах) к (E)SI и 
(Е) DI 

ELSE 

Вычесть размер операнда (в байтах) из (E)SI и 
(E)DI 


END IF 
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Операция 


Команда MOVS похожа на обычную MOV передачи 
из области памяти, адресуемой SI, в область дополни¬ 
тельного сегмента, адресуемого DI. Но' она автоматиче¬ 
ски корректирует индексы: если DF=0, производится ин¬ 
кремент, а в противном случае — декремент. Величина 
коррекции зависит от размера операнда (1=байт, 2=сло- 
во, 4=двойное слово). 


Особые случаи Режимы Причины 


#GP(0) 

P 

Результат в защищенном от 
записи сегменте 

#GP(0) 

P 

Недопустимый эффективный 

адрес памяти в сегментах CS, 
DS, ES, FS, GS 

#SS(0) 

P 

Неверный адрес в сегменте SS 

#PF (fc) 

P V 

Страничное нарушение 

INT(13) 

R V 

Часть операнда вне диапазона 
адреса от 0 до 0FFFFH 


Примечания 


Команду MOVS нельзя использовать с префиксом 
REPE или REPS, так как она не воздействует на флаж¬ 
ки. Однако префикс REP действует как обычно, вызы¬ 
вая передачу СХ байт или слов из источника в получа¬ 
тель. 

Команда MOVS осуществляет простую передачу 
с заданием известной длины в СХ, но если передачу 
нужно остановить при встрече нужного байта, потре¬ 
буется другой способ, например, с использованием 
LODS, проверки, STOS, и повторения с помощью коман¬ 
ды LOOP. 
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Пример 


CLD 

LDS ESI.STR1 

LES EDI.STR2 

MOV ЕСХ,5 

REPE MOVSD 


Направление вперед. 
Указатель источника 

DS: [ESI ]. 

Указатель получателя 

ES: [EDI ]. 

Счетчик повторения. 

5 раз копирует из STR1 
в STR2. 


7 За 
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MUL Беззнаковое 

умножение (8086) 


КОП 

Формат 

Такты 

F6 [4] 

MUL r/mb 

9-14/12-17 

F7 [4] 

MUL r/mw 

9-22/12-25 

F7 [4] 

MUL r/md 

9-38/12-41 

Флажки 





NT 

IOPL 

OF 

DF 

IF 

TF 

SF 

ZF 


AF 


PF 


CF 

0 



S 




U 

U 

0 

U 

0 

U 

1 

S 


Псевдокод 

IF размер операнда байт THEN 

Установить АХ на произведение AL и операнда 
ELSE IF размер операнда слово THEN 

Установить DX:AX на произведение АХ и операн¬ 
да 

ELSE (^размер операнда — двойное слово*) 

Установить EDX:EAX на произведение ЕАХ и 
операнда 

END IF 


Операция 

Все операнды считаются беззнаковыми числами, та¬ 
кими же являются результаты. Размер произведения п- 
битных сомножителей равен 2п. 
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Особые случаи Режимы Причины 


#GP (0) 


Р Недопустимый эффективный 

адрес памяти в сегментах CS, 


#SS(0) 

#P.F(fc) 

INT(13) 


Р Неверный адрес в сегменте SS 

Р V Страничное нарушение 

R V Часть операнда вне диапазона 

адреса от 0 до 0FFFFH 


Примечания 

Время умножения зависит от значения множителя. 
Чем больше значащих бит, тем дольше длится операция. 
В процессоре 80386 реализован алгоритм- «досрочного» 
окончания операции. Указанный операнд в команде 
MUL называется оптимизирующим множителем («ш» в 
приведенных выражениях). Фактически число тактов для 
умножения можно найти по выражению: 

IF m - 0 THEN тактов - 9 
ELSE тактов - max(log2(lml),3)+6 


Пример 


MOV AL,128 
MOV BL,10 
MOV BL 


В AL загружается 128 (80H). 
В BL загружается 10 (OAH). 
AX содержит 1280 (500H), 

OF-1. 
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NEG Изменение знака 
( 8086 ) 


КОП 

Формат 

Такты 

F6 [3 ] 

NEG r/mb 

2/6 

F7 [3] 

NEG r/mw 

2/6 

F7 [3 ] 

NEG r/md 

2/6 

Флажки 





NT 

IOPL 

OF 

DF 

IF 

TF 

SF 

ZF 


AF 


PF 


CF 

0 



S 




S 

S 

0 


0 

S 

1 

S 


Псевдокод 

Вычесть операнд из нуля 
Поместить результат в операнд 
IF операнд нуль THEN 
сбросить CF-0 
ELSE 

установить CF-1 
END IF 


Операция 

Команда NEG изменяет знак своего единственного 
операнда. 

Сначала производится его инвертирование, а затем 
инкремент. Можно также считать, что операнд вычита¬ 
ется из нуля. 
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Особые случаи Режимы Причины 


#GP(0) 

Р 

Результат в защищенном от 
записи сегменте 

#GP(0) 

Р 

Недопустимый эффективный 

адрес памяти в сегментах CS, 
DS, ES, FS, GS 

#SS(0) 

Р 

Неверный адрес в сегменте SS 

#PF(fc) 

Р V 

Страничное нарушение 

INTC13) 

R V 

Часть операнда вне диапазона 
адреса от 0 до 0FFFFH 

Примечания 

Команда 
ется довольно 

NEG для 
часто. 

изменения знака числа примени- 


Пример 


MOV АХ,579ВН ; Загружает значение в АХ. 

NEG АХ ; В АХ 0А865Н. 
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NOP Нет операции (8086) 

КОП Формат Такты 

90 NOP 3 

Флажки 



NT 

IOPL 

OF 

DF 

IF 

TF 

SF 

ZF 


AF 


PF 


CF 

0 









0 




Г 



Псевдокод 

Ничего не делать 3 такта. 


Операция 

Команда NOP занимает байт кода и выполняется за 
три такта. Ни один элемент не применяется. Команда 
NOP — это альтернативное название команды XCHG 
АХ,АХ. 


Особые случаи 


Примечания 

Команда NOP ничего не делает, а это необходимо 
достаточно часто. Она применяется при отладке и для 
внесения «заплат». Ассемблер также применяет команды 
NOP. Если он не может предсказать число байт в ко- 
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манде, он занимает максимальную область, и ненужная 
часть после определения точного размера заполняется 
командами NOP. 


Пример 

NOP ; Не делать ничего. 
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NOT 

Инвертирование 

(8086) 

коп 

Формат Такты 

F6 [2] 

F7 [2] 

F7 [2] 

NOT r/mb 2/6 

NOT r/mw 2/6 

NOT r/md 2/6 

Флажки 




NT 

IOPL 

OF 

DF 

IF 

TF 

SF 

ZF 


AF 

Г 

PF 


CF 

0 








_ 

0 


0 


1 



Псевдокод 

REPEAT 

Инвертировать бит в операнде 
UNTIL до инвертирования всех бит в операнде 


Операция 

Команда NOT выполняет логическую функцию НЕ 
над своими операндами и оставляет результат в операн¬ 
де (см. табл. 4.1). Прибавление к результату 1 дает до¬ 
полнительный код. 


Особые случаи Режимы Причины 

#GP(0) Р Результат в защищенном от 

записи сегменте 

#GP(0) Р Недопустимый эффективный 

адрес памяти в сегментах CS, 

DS, ES, FS, GS 
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#SS(0) Р Неверный адрес в сегменте SS 

#PF(fc) Р V Страничное нарушение 

INT(13) R V Часть операнда вне диапазона 

адреса от 0 до 0FFFFH 


Примечания 

Команда NOT применяется для проверки бит и 
сравнений; многие из них можно выполнять с помощью 
новых команд манипуляций битами. 

Для многих применений является недостатком то, 
что команда NOT не воздействует на флажки. 


Пример 


MOV АХ,579ВН ; Загружает данные в АХ. 

NOT АХ ; АХ=0А864Н. 
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OR Логическое ИЛИ 



( 8086 ) 


КОП 

Формат 

Такі 

ОС ib 

OR AL,ib 

2 

OD iw 

OR AX,iw 

2 

OD id 

OR EAX,id 

2 

80 [1] ib 

OR r/mb,ib 

2/7 

81 [1] iw 

OR r/mw,iw 

2/7 

81 [1] id 

OR r/md,id 

2/7 

08 [r] 

OR r/mb,rb 

2/7 

09 [r] 

OR r/mw,rw 

2/7 

09 [r] 

OR r/md,rd 

2/7 

0A [r] 

OR rb,r/mb 

2/7 

0B [r] 

OR rw,r/mw 

2/7 

0B [r] 

OR rd,r/md 

2/7 

Флажки 





NT 

IOPL 

OF 

DF 

IF 

TF 

SF 

ZF 


AF 


PF 


CF 

0 



0 




S 

S 

0 


0 

S 

1 

0 


Псевдокод 


REPEAT 

IF бит в получателе 0 и соответствующий бит в 
источнике 0 THEN 
сохранить бит получателя О 
ELSE 

установить бит получателя в 1 
END IF 

UNTIL до проверки всех бит в получателе 
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Операция 

Команда OR выполняет логическую функцию ИЛИ 
над операндами и оставляет результат в первом операн¬ 
де (см. табл. 4.1). Эта функция часто называется 
«включающим» ИЛИ. Операнды команды OR должны 
иметь одинаковую длину. 


Особые случаи Режимы Причины 

#GP(0) Р Результат в защищенном от 

записи сегменте 

#GP(0) Р Недопустимый эффективный 

адрес памяти в сегментах CS, 
DS, ES, FS, GS 

#SS(0) Р Неверный адрес в сегменте SS 

#PF(fc) Р V Страничное нарушение 

INT(13) R V Часть операнда вне диапазона 

адреса от 0 до OFFFFH 


Примечания 

Команда OR применяется для установки бит; это 
нельзя реализовать Новыми командами манипуляций 
битами. 


Пример 

MOV АХ,5963Н ; Загружает число в АХ. 

MOV ВХ,6СА5Н ; Загружает число в ВХ. 

OR АХ,ВХ ; AX-7DE7H. 
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OUT 

Вывод в 

порт ( 8086 ) 

коп 

Формат 

Такты 

Е6 ІЬ 

OUT ib,AL 

3 

Е7 ib 

OUT ib,AX 

3 

Е7 ib 

OUT ib.EAX 

3 

ЕЕ 

OUT DX,AL 

4 

EF 

OUT DX,AX 

4 

EF 

OUT DX,EAX 

4 

Флажки 





NT 

IOPL 

OF 

DF 

- 

TF 

SF 

ZF 


AF 


PF 


CF 

0 









0 


0 


71 



Псевдокод 

IF первый операнд непосредственный THEN 

Расширить нулями первый операнд до 16 бит 
ELSE 

Адрес выходного порта находится в DX 
END IF 

IF размер второго операнда байт THEN 
Передать байт из AL в выходной, порт 
ELSE IF размер второго операнда слово THEN 
Передать слово из АХ в выходной порт 
ELSE (^размер второго операнда двойное слово*) 
Передать двойное слово из АХ в выходной порт 
END IF 


Операция 

Команда OUT применяется для вывода одного бай¬ 
та, слова или двойного слова в порт периферийного уст¬ 
ройства. Номер порта может быть числом от 0 до 
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65535. Обычно устройство имеет несколько отдельных 
портов для команд, слова состояния и данных. Первые 
два из них применяются для управления устройством. 

Номера портов 00F8H — 00FFH зарезервированы 
фирмой Intel и их использовать не следует. 


Особые случаи Режимы Причины 

#GP(0) Р Текущая привилегия больше 

IOPL 

#GP(0) V Некоторые биты разрешения в 

TSS содержат 1 


Примечания 

Большинство программ осуществляют вывод через 
вызовы операционной системы, и в них не применяется 
команда OUT. Часто прямой вывод, например, в видео - 
RAM производится командой MOV. Однако команда 
OUT важна для разработчиков драйверов устройств и 
для прямого взаимодействия с устройством. Когда требу¬ 
ется вывести несколько байт, следует пользоваться ко¬ 
мандой OUT. Если устройство вывода не может воспри¬ 
нимать данные с большой скоростью, команду OUT сле¬ 
дует поместить в цикл и управлять скоростью передачи 
введением задержки. 


Пример 

MOV AL,20H ; Загружает код пробела в AL. 
OUT 30, AL ; Выводит его в порт 30. 
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OUTS Вывод циклический 
в порт ( 80186 ) 


КОП 

Формат 

Такты 

(одиночная) 

Такты 

(с повторением) 

6Е 

OUTSB 

7 

5+5*N 

6F 

OUTSW 

7 

5+5*N 

6F 

OUTSD 

7 

5+5*N 


Буква N обозначает число в регистре (Е)СХ. 


Флажки 



NT 

IOPL 

OF 

DF 


TF 

SF 

ZF 


AF 


PF 


CF 

0 







— 


0 


_ 


_ 

1 



Псевдокод 

IF размер операнда байт THEN 

Передать байт из DS:[(E)SI] в выходной порт с 
номером DX 

ELSE IF размер операнда слово THEN 

Передать слово из DS:[(E)SI] в выходной порт с 
номером DX 

ELSE (*размер операнда двойное слово*) 

Передать двойное слово из DS: I (E)SI ] в выходной 
порт с номером в DX 
END IF 
IF DF=0 THEN 

Прибавить к (E)SI размер операнда (в байтах) 
ELSE 

Вычесть из (E)SI размер операнда (в байтах) 

END IF 
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Операция 

Команда OUTS, как и OUT, применяется для выво¬ 
да в порт периферийного устройства одного байта, слова 
или двойного слова. 

Номер порта может быть числом от 0 до 65535. 
Обычно устройство имеет несколько портов для команд, 
слова состояния и данных. Через первые два произво¬ 
дится управление устройством. 

В команде OUTS номер порта всегда находится в 
DX, а источник данных адресуется DS:[(E)SI], если нет 
префикса замены сегмента. 

Команда OUTS рассчитана на использование пре¬ 
фикса REP, т. е. в конце команды производиться декре¬ 
мент или инкремент (Е) SI на размер операнда. 


Особые случаи Режимы Причины 


#GP(0) 

#GP(0) 


#SS(0) 
#PF (fc) 
INT(13) 

#GP(0) 


P Текущая привилегия больше 

IOPL 

P Недопустимый эффективный 

адрес памяти в сегментах CS, 
DS, ES, FS, GS 

Р Неверный адрес в сегменте SS 

Р V Страничное нарушение 

R V Часть операнда вне диапазона 

адреса от 0 до OFFFFH 
V Некоторые биты разрешения в 

TSS содержат 1 


Примечания 

Большинство программ осуществляют вывод через 
вызовы операционной системы и не используют команду 
OUTS. Однако команда OUTS важна для разработчиков 
драйверов устройств и для прямого взаимодействия с ус¬ 
тройством. Если устройство не может воспринимать дан¬ 
ные с большой скоростью, команду OUTS следует поме¬ 
стить в цикл и регулировать скорость с помощью введе¬ 
ния команд NOP или задержек. 
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Пример 

CLD 

LDS 

MOV 

MOV 


ESI.OUTSTR 

ЕСХ,5 

DX,40 


Направление вперед. 
Адрес источника вывода 
в DS: (ESI ]. 

Счетчик повторения в 
ЕСХ. 

Номер выходного порта 
в DX. 

Вывести 5 байт в порт 
40. 


REP OUTSB 
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POP Извлечение из стека 
в операнд ( 8086 ) 


КОП 

Формат 

Так 

8F [0] 

POP mw 

5 

8F [0] 

POP rad 

5 

58+rw 

POP rw 

4 

58+rd 

POP rd 

4 

IF 

POP DS 

7,* 

07 

POP ES 

7,* 

17 

POP SS 

7,* 

OF A1 

POP FS 

7,* 

OF A9 

POP GS 

7,* 


*В защищенном режиме эти команды выполняются за 
21 такт из-за дополнительной обработки (см. гл. 5). 


Флажки 



NT 

IOPL 

OF 

DF 

IF 

TF 

SF 

ZF 


AF 


PF 


CF 

0 









0 


0 


1 



Псевдокод 

IF размер операнда слово THEN 

Передать слово из SS:[(E)SP) в получатель 
Прибавить 2 к (E)SP 
ELSE (*размер операнда двойное слово*) 

Передать двойное слово из SS:[(E)SP] в получа¬ 
тель 

Прибавить 4 к (E)SP 
END IF 
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Операция 

Команда POP передает слово из вершины стека в 
операнд, а вершина стека адресует другое слово. В част¬ 
ности, команда POP копирует слово, адресуемое SS:SP в 
операнд. Затем SP устанавливается на SP+2 (или SP+4). 
Так как стек начинается по адресу в SS и растет вниз, 
то инкремент SP уменьшает стек. 

Все программисты должны уметь работать со сте¬ 
ком. 

При использовании команды POP имеют место две 
дополнительные особенности. Во-первых, при выполнении 
команды POP SS в реальном режиме автоматически за¬ 
прещаются все прерывания до завершения следующей 
команды. Предполагается, что этой следующей командой 
будет POP SP или другая команда, модифицирующая 
SP. 

Во-вторых, при извлечении в любой сегментный ре¬ 
гистр в защищенном режиме процессор будет обращаться 
к другой области памяти, имеющей, возможно, другой 
уровень защиты, чем текущая. Подробнее о защите см. 
главу 5. 


Особые случаи Режимы Причины 


#GP, #SS, #NP Р 


#GP(0) Р 

#GP(0) Р 

#SS(0) Р 

#PF(fc) Р V 

INT (13) R V 


Загружается сегментный ре¬ 
гистр 

Результат в защищенном от 
записи сегменте 
Недопустимый эффективный 
адрес памяти в сегментах CS, 
DS, ES, FS, GS 
Неверный адрес в сегменте SS 
Страничное нарушение 
Часть операнда вне диапазона 
адреса от 0 до OFFFFH 


Примечания 

В любой подпрограмме число включений PUSH дол¬ 
жно быть равно числу извлечений POP. При несовпаде¬ 
нии возникнут ошибки во время выполнения. С исполь- 
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зованием стека связано несколько стандартных приемов. 
При извлечении слово сохраняется в RAM и его можно 
извлечь повторно. Можно поместить значения в стек и 
сразу выполнить RET или IRET, зная о том, что уп¬ 
равление передается новому значению. 

Многие эти приемы не могут использоваться в но¬ 
вых процессорах іАРХ при ужесточении ограничений за¬ 
щиты. Об этом нужно помнить новому поколению про¬ 
граммистов. 


Пример 


См. команду PUSH. 



212 


Инструкции процессора 80386 


РОРА Извлечение из стека 
значений регистров 
( 80186 ) 

КОП Формат Такты 

61 РОРА 24 

61 POPAD 24 


Флажки 



NT 

IOPL 

OF 

DF 

IF 

TF 

SF 

ZF 


AF 

I 

PF 


CF 

0 






"1 



0 


0 


1 



Псевдокод 

(♦Детали операции извлечения см. в команде POP*) 
IF размер операнда слово THEN 
POP DI 
POP SI 
POP BP 

POP BX (*Удалить значение SP из стека*) 

POP BX 
POP DX 
POP CX 
POP AX 

ELSE (*размер операнда двойное слово*) 

POP EDI 
POP ESI 
POP EBP 

POP EBX (*Удалить значение ESP из стека*) 
POP EBX 
POP EDX 
POP ECX 
POP EAX 
END IF 
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Операция 

Команда РОРА извлекает 8 слов из вершины стека 
в регистры (E)DI, (E)SI, (Е)ВР, (E)SP, (Е)ВХ, (E)DX, 
(Е)СХ и (Е)АХ. Отметим, что извлекаемое для (E)SP 
значение уничтожается, а не сохраняется в регистре. 
Новое значение (E)SP таково, как будто выполнено 8 
команд POP. 


Особые случаи Режимы Причины 


#SS(0) 

#PF(fc) 

INT(13) 


Р Неверный адрес в сегменте SS 

Р V Страничное нарушение 

R V Часть операнда вне диапазона 

адреса от 0 до OFFFFH 


Примечания 

Эта команда заменяет 8 отдельных команд POP и 
выполняется быстрее их на 8 тактов. Пользоваться ей 
проще, чем серией команд POP. Для упрощения кода 
следует пользоваться РОРА (и предшествующей ей ко¬ 
мандой PUSHA), даже если в стек нужно включить два 
или три регистра. Однако нужно помнить и об увеличе¬ 
нии времени выполнения команды. 

Команда РОРА предназначена для реализациии язы¬ 
ков высокого уровня, когда непредсказуемые уровни 
вложения требуют сохранения и восстановления всех ре¬ 
гистров при каждом вызове подпрограммы. 

Знание порядка загрузки регистров позволяет реали¬ 
зовать несколько приемов загрузки новых значений в 
регистры, обходя механизмы защиты. Но в защищенном 
режиме могут возникнуть проблемы. 


Пример 


См. команду PUSHA. 
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POPF 

Восстановление 
флажков ( 8086 ) 

коп 

Формат 

Такты 

9D 

POPF 

5 

9D 

POPFD 

5 

Флажки 





NT 

IOPL 

OF 

DF 

, F 

TF 

SF 

ZF 


AF 


PF 


CF 

0 

S 

* * 

S 

S 


s 

S 

S 

0 

S 

0 

S 

1 

S 


*IOPL изменяется только на уровне привилегий 0; IF 
изменяется, когда привилегия меньше или равна IOPL. 


Псевдокод 

(•подробнее об извлечении из стека см. команду 
POP*) 

IF размер операнда слово THEN 
POP в Flags 

ELSE (*размер операнда двойное слово*) 

POP в EFlags 
END IF 


Операция 

Команда POPF копирует слово, адресуемое 
SS:[(E)SP] в регистр флажков, а затем производит инк¬ 
ремент SP на 2 (или на 4). 

Инкремент SP соответствует уменьшению стека. 
Отметим, что эта команда не изменяет флажки ѴМ 
и RF. Кроме того, флажки IOPL и IF нельзя изменять, 
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если у текущей задачи недостаточно привилегий. В этом 
случае особый случай прерывания не возникает. 


Особые случаи Режимы Причины 


#SS(0) 
#GP (0) 

INT (13) 

#GP(0) 


P Неверный адрес в сегменте SS 

V Используется для эмулирова¬ 

ния команды 

R Часть операнда вне диапазона 

адреса от 0 до QFFFFH 

V IOPL менее 3 


Примечания 

Команда POPF, как и РОРА, помогает реализовать 
компиляторы языков высокого уровня. Команды PUSHF 
и POPF позволяют сохранять и восстанавливать сразу 
все флажки. Обычно они применяются до и после вызо¬ 
ва подпрограммы или в начале и в конце самой под¬ 
программы. 

Конечно, команду POPF можно использовать и при 
программировании на ассемблере. Кроме совместного 
применения с PUSHF, она позволяет загрузить в ре¬ 
гистр флажков нужный двоичный набор (сначала его 
нужно включить в стек, а затем извлечь командой 
POPF). При этом нужно помнить о важности флажков 
IOPL и NT. 


Пример 


См. команду PUSHF. 
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PUSH Включение операнда 
в стек ( 8086 ) 


КОП 

Формат 

Такты 

FF [6] 

PUSH mw 

5 

FF [6] 

PUSH md 

5 

50+r 

PUSH rw 

2 

50+r 

PUSH rd 

2 

6A ib 

PUSH ib 

2 

68 iw 

PUSH iw 

2 

68 id 

PUSH id 

2 

0E 

PUSH CS 

2 

IE 

PUSH DS 

2 

06 

PUSH ES 

2 

16 

PUSH SS 

2 

OF AO 

PUSH FS 

2 

OF A8 

PUSH GS 

2 

Флажки 





NT 

IOPL 

OF 

DF 

IF 

TF 

SF 

ZF 


ЛР 


PF 


CF 

0 



— 






0 


0 


_ 

. 



Псевдокод 

IF размер операнда слово THEN 
Вычесть 2 из (E)SP 
Передать слово-источник в SS:[(E)SP] 

ELSE (*размер операнда двойное слово*) 

Вычесть 4 из (E)SP 

Передать двойное слово-источник в SS:[(E)SP] 
END IF 
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Операция 

Команда PUSH помещает операнд в вершину стека 
с предварительной коррекцией указателя стека. Так 
как стек начинается по адресу из регистра SS и растет 
вниз, то декремент SP делает стек больше. 

Программисту необходимо знать, что при использо¬ 
вании команды PUSH возникают две дополнительные 
проблемы. Первая связана с командой PUSH SP. В 
предыдущих процессорах іАРХ 86 она выполнялась 
обычным образом: декремент SP на 2 и включение его 
значения в стек. Однако в процессорах 80286 и 80386 
в стек включается значение SP до декремента, что 
обычно и нужно программистам при включении в 
стек SP. 

Вторая проблема почти всегда игнорируется: если 
при выполнении PUSH регистр (E)SP равен 1, то про¬ 
цессор 80386 отключается из-за недостатка стекового 
пространства. Однако, такая ситуация маловероятна. 


Особые случаи Режимы Причины 


#GP(0) 


#SS(0) 
#PF (fc) 


P Недопустимый эффективный 

адрес памяти в сегментах CS, 
DS, ES, FS, GS 

Р Неверный адрес в сегменте SS 

Р V Страничное нарушение 

R V Отключение из-за недостатка 

стекового пространства 


Примечания 

Помните, что в подпрограмме число команд PUSH 
и POP должно быть одним и тем же. Неравенство вызо¬ 
вет серьезные проблемы во время выполнения. 

С использованием стека связано несколько стандарт¬ 
ных приемов. Можно включить в него несколько слов и 
затем изменить SP так, что они не будут мешать при 
вызовах подпрограмм. Когда данные больше не нужны, 
следует просто восстановить прежнее значение SP. Мож¬ 
но также поместить в стек значения и сразу выполнить 
RET или IRET, зная, что управление передается новому 
значению. Многие из этих приемов не могут использо- 




218 


Инструкции процессора 80386 


ваться в процессоре 80386 по мере увеличения размера 
слова и ограничений защиты. 


Пример 

PUSH ЕАХ 

IMUL ЕАХ,МЕМШС,10 
MOV MEMLOC.EAX 
POP ЕАХ 


; Освободить ЕАХ. 

; Умножить МЕМ на 10. 

; Сохранить результат. 

; Восстановить старое 
; значение ЕАХ. 
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PUSH А Включение в стек 
значений регистров 
( 80186 ) 


КОП 

Формат 

Такты 

60 

PUSHA 

18 

60 

PUSHAD 

18 

Флажки 





NT 

IOPL 

OF 

DF 

IF 

TF 

SF 

ZF 




PF 

L 

CF 

0 









0 


0 


71 



Псевдокод 

(*Об операции включения см. команду PUSH*) 

IF размер операнда слово THEN 

Сохранить значение SP во внутреннем регистре 

PUSH АХ 

PUSH СХ 

PUSH DX 

PUSH ВХ 

PUSH сохраненное значение SP 
PUSH ВР 
PUSH SI 
PUSH DI 

ELSE (*размер операнда двойное слово*) 

Сохранить значение ESP во внутреннем регистре 

PUSH ЕАХ 

PUSH ЕСХ 

PUSH EDX 

PUSH ЕВХ 

PUSH сохраненное значение ESP 
PUSH EBP 
PUSH ESI 
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PUSH EDI 
END IF 


Операция 

Команда PUSHA включает в вершину стека 8 слов 
содержимого регистров (Е)АХ, (Е)СХ, (E)DX, (Е)ВХ, 
(E)SP, (Е)ВР, (E)SI и (E)DI. Для (E)SP включается 
значение до выполнения команды. Новое значение (E)SP 
таково, как будто выполнены 8 команд PUSH. 

Если SP содержит 1, 3 или 5 до выполнения 

PUSHA, то процессор 80386 отключается без выполне¬ 
ния команд PUSH. Если SP — нечетное число от 7 до 
15, возникает особый случай прерывания 13. 


Особые случаи Режимы Причины 


#SS(0) 

#PF(fc) 


INT<13) 


Р Неверный адрес в. сегменте SS 

Р V Страничное нарушение 

R V Отключение из-за недостатка 

стекового пространства 
R Часть операнда вне диапазона 

адреса от 0 до OFFFFH 


Примечания 

Эта команда заменяет 8 отдельных команд PUSH, 
требуя всего два лишних такта, но занимая только 1/8 
часть кода. Главное ее достоинство — простота включе¬ 
ния в стек всех регистров общего назначения. 

Для упрощения кода PUSHA (с последующей 
РОРА) следует применять даже при необходимости со¬ 
хранения в стеке 2 или 3 регистров. В части экономии 
времени команда PUSHA не дает преимуществ. 

Команда PUSHA важна для реализации языков вы¬ 
сокого уровня, когда непредсказуемые уровни вложения 
требуют при вызове каждой процедуры сохранения и 
восстановления содержимого всех регистров. 
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Пример 

SUBROUTINE: 


PUSHA 

; Сохранить 

значения всех 


; регистров в 

стеке. 

POP А ’ 

; Восстановить 

значения всех 


; регистров из 

стека. 

RET 

; Возврат из подпрограммы. 
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PUSHF Включение в стек 
флажков ( 8086 ) 


КОП 

Формат 

Такты 

9С 

PUSHF 

4 

9С 

PUSHFD 

4 


Флажки 



NT 

IOPL 

OF 

DF 

IF 

TF 

SF 

ZF 


AF 


PF 


CF 

0 









0 


0 


1 



Псевдокод 

(•подробнее о включении в стек см. команду 
PUSH*) 

IF размер операнда слово THEN 
PUSH из Flags 

ELSE (‘размер операнда двойное слово*). 

PUSH из EFlags 
END IF 


Операция 

Команда PUSHF уменьшает (E)SP на 2 (или 4) и 
затем копирует регистр (Е) Flags в слово, адресуемое 
SS:[(E)SP]. Декремент (E)SP делает стек больше. 

Процессор 80386 в реальном режиме отключается, 
если SP-1, из-за недостатка стекового пространства. 
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Особые случаи Режимы Причины 


#SS(0 

#GP(0) 

#GP(0) 


Р Неверный адрес в сегменте SS 

R Отключение из-за недостатка 

стекового пространства 

V Используется для эмулирова¬ 

ния команды 

V IOPL менее 3 


Примечания 

Команда PUSHF, как и PUSHA, предназначена как 
помощь в реализации компиляторов языков высокого 
уровня. Команды PUSHF и POPF позволяют сохранять 
и восстанавливать сразу все флажки. Они применяются 
либо до и после вызова подпрограммы, либо в ее нача¬ 
ле и конце. 

Конечно, команду PUSHF можно использовать и 
при программировании на ассемблере. Она позволяет 
включить в стек флажки и извлечь их оттуда в другой 
регистр для проверки и реализации условных переходов.' 


Пример 

PUSHF ; Сохранить флажки в 

; стеке. 

OR SS:[SP],800H ; Установить OF=l. 

POPF ; Восстановить флажки. 
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REPcc Префикс повторения 
( 8086 ) 


КОП 

Формат 

Условие 

F2 * 

REP * 

(Е)СХХ) 

F3 * 

REPE * 

(Е)СХХ) 

F2 * 

REPNE * 

(Е)СХХ) 

F2 * 

REPNZ * 

<Е)СХХ) 

F3 * 

REPZ * 

(Е)СХХ) 


Команды Такты 
повторения 

INS, MOVS, * 
OUTS, STOS 
и ZF=1 CMPS, SCAS * 
и ZF=0 CMPS, SCAS * 
и ZF=0 CMPS, SCAS * 
и ZF=1 CMPS, SCAS * 


*См. описания отдельных циклических команд. 


Флажки 

Префиксы повторения не воздействуют на флажки, 
но сами циклические команды на них воздействуют (см. 
описания отдельных команд). 


Псевдокод 

IF (СХ<>0) THEN (*если в начале СХ-0, цикл не 
выполняется*) 

REPEAT 

Отреагировать на ожидающее прерывание 
Выполнить циклическую операцию после REPcc 
Декремент СХ на 1 (*флажки не изменяются*) 
UNTIL условие повторения не удовлетворяется 
(*если ZF контролируется, это делается после 
команды*) 

END IF 
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Операция 

Группа префиксов REP применяется только с цик¬ 
лическими командами. 

Вначале (Е)СХ проверяется на 0, и если СХ=0, ко¬ 
манда не выполняется. Если СХ не равен нулю, цикли¬ 
ческая команда выполняется с повторением до тех пор, 
пока СХ не достигнет нуля или (для REPE, REPNE, 
REPNZ и REPZ) флажок ZF не изменит своего зна¬ 
чения. 

В начале каждой итерации цикла обрабатываются 
прерывания. После этого обычным образом выполняется 
циклическая команда. Затем производится декремент СХ 
без изменения флажков. Цикл повторяется до тех пор, 
пока удовлетворяется условие повторения. 

Цикл не выполняется совсем, если первоначально 
СХ=0, но выполняется минимум один раз независимо от 
состояния ZF. 

Циклические команды специально созданы для рабо¬ 
ты с префиксами типа REP. При выполнении они авто¬ 
матически корректируют указатели SI и DI в зависимо¬ 
сти от состояния флажка DF (0=инкремент, ^декре¬ 
мент) . 


Особые случаи 

Префиксы повторения не генерируют особых случа¬ 
ев прерывания, но некоторые циклические команды фор¬ 
мируют их (см. описания отдельных команд). 


Примечания 

Имеется три преимущества использования префиксов 
типа REP. Во-первых, они компактны; одна строка со¬ 
держит эквивалент нескольких (до 6) команд. Во-вто¬ 
рых, экономится время выполнения; управление циклом 
реализуется быстрее на 10 тактов по сравнению с обыч¬ 
ными командами. Третье достоинство — простота ис¬ 
пользования префиксов REPcc: идея программиста вопло¬ 
щается в одну строку кода, что редко встречается в 
языке ассемблер. Но из-за множества вариантов опера¬ 
ций префиксы увеличивают возможность ошибки. Непра- 

8 Зак. 2046 
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вильная инициализация СХ, например, приводит к пе¬ 
чальным последствиям. 

Внимательно проверьте команды REP INS и REP 
OUTS, так как не все порты могут передавать данные с 
достаточно большой скоростью. В этом случае придется 
искусственно замедлять цикл. 

Для различения причин прекращения цикла (СХ=0 
или из-за флажка ZF) можно использовать команды 
JCXZ или JZ/JE и JNZ/JNE сразу после REPcc. 


Пример 

LDS SI,SRC_STR ; Указатель массива-источ- 

; ника. 

LES DI,DEST_STR ; Указатель массива-получа- 

; теля. 

MOV ECX.STRLEN ; Число передаваемых байт. 

REP MOVSB ; Передать SRC_STR в 

; DEST_STR. 
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RET Возврат после вызова 
( 8086 ) 


КОП 

Формат 

сз 

RET 

СВ 

RET 

С2 iw 

RET iw 

СА iw 

RET iw 


Тип Такты 

Короткий 10+т 

Длинный 18+т** 

Короткий* 10+т 

Длинный* 18+т** 


*С извлечением из стека параметров. 

**В защищенном режиме эти команды имеют другие 
функции и время выполнения. 


Флажки 

Обычно команда RET не воздействует на флажки. 
Но если в защищенном режиме производится переклю¬ 
чение задачи, все флажки изменяются на сохраненные 
флажки старой задачи. 


Псевдокод 

POP IP из стека 
IF длинный возврат THEN 
POP CS из стека 
END IF 

IF задан счетчик байт THEN 

Извлечь столько-то байт из стека 
END IF 


Операция 

Возврат после вызова в том же сегменте кода, где 
находится подпрограмма (короткий возврат) очень прост. 
Из вершины стека извлекается IP. В случае длинного 
возврата производится извлечение CS. В любом случае 
выполнение продолжается по адресу из CS:IP. 
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Вторая форма команды RET позволяет указать чис¬ 
ло байт параметров, находящихся в стеке. Перед возвра¬ 
том в вызывающую процедуру процессор удаляет пара¬ 
метры из стека. 

Основная процедура такая же, как в защищенном 
режиме, но межсегментные возвраты намного сложнее, 
так как команда CALL может определять процедуру 
операционной системы или даже другую задачу. В лю¬ 
бом случае необходимо проверять защиту памяти (см. 
гл. 5). 


Особые случаи Режимы Причины 


#NP 

#TS 

#GP(0) 


#SS(0) 
#PF (fc) 
INT(13) 


P Заданный сегмент кода отсут¬ 

ствует 

Р Требуется переключение зада¬ 

чи 

Р Недопустимый эффективный 

адрес памяти в сегментах CS, 
DS, ES, FS, GS 

Р Неверный адрес в сегменте SS 

Р V Страничное нарушение 

R V Часть операнда вне диапазона 

адреса от 0 до OFFFFH 


Примечания 

.Много программных приемов реализуются путем 
включения различных значений в стек с последующим 
выполнением команды RET. Но при защите памяти та¬ 
кие приемы становятся сложнее. Например, в процессоре 
80386 размер сегмента не фиксирован, поэтому возврат 
по адресу внутри диапазона 64 Кбайт не обязательно 
приходится на тот же самый сегмент. В случае исполь¬ 
зования виртуальной памяти, адрес, по которому возвра¬ 
щается управление, может вообще быть вне пределов 
оперативной памяти. 


Пример 


RET 8 ; Извлекает из стека 8 байт параметров. 
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Rxx Циклический сдвиг 
( 8086 ) 


коп 


Формат 

Такты 

D0 

[2] 


RCL г/ mb, 1 

9/10 

D2 

[2] 


RCL r/mb.CL 

9/10 

СО 

[2] 

ib 

RCL r/mb,ib 

9/10 

D1 

[2] 


RCL r/mw,l 

9/10 

D3 

[2] 


RCL r/mw.CL 

9/10 

С1 

[2] 

ib 

RCL r/mw,ib 

9/10 

D1 

[2] 


RCL r/md,l 

9/10 

D3 

[2] 


RCL r/md,CL 

9/10 

С1 

[2] 

ib 

RCL r/md,ib 

9/10 

DO 

[3] 


RCR r/mb,l 

9/10 

D2 

[3] 


RCR r/mb.CL 

9/10 

СО 

[3] 

ib 

RCR r/mb,ib 

9/10 

D1 

[3] 


RCR r/mw,l 

9/10 

D3 

[3] 


RCR r/mw,CL 

9/10 

С1 

[3] 

ib 

RCR r/mw,ib 

9/10 

D1 

[3] 


RCR r/md,l 

9/10 

D3 

[3] 


RCR r/md,CL 

9/10 

С1 

[3] 

ib 

RCR r/md,ib 

9/10 

DO 

[0] 


ROL r/mb,l 

3/7 

D2 

[0] 


ROL r/mb,CL 

3/7 

СО 

[0] 

ib 

ROL r/mb,ib 

3/7 

D1 

[0] 


ROL r/mw,l 

3/7 

D3 

[0] 


ROL r/mw,CL 

3/7 

С1 

[0] 

ib 

ROL r/mw,ib 

3/7 

D1 

10] 


ROL r/md.l 

3/7 

D3 

[0] 


ROL r/md,CL 

3/7 

С1 

[01 

ib 

ROL r/md,ib 

3/7 

DO 

[1] 


ROR r/mb,l 

3/7 

D2 

[1] 


ROR r/mb,CL 

3/7 

СО 

[1] 

ib 

ROR r/mb,ib 

3/7 

D1 

[1] 


ROR r/mw,l 

3/7 

D3 

[1] 


ROR r/mw,CL 

3/7 

С1 

[11 

ib 

ROR r/mw.ib 

3/7 

D1 

[1] 


ROR r/md,l 

3/7 

D3 

[1] 


ROR r/md,CL 

3/7 

С1 

[1 lib 

ROR r/md,ib 

3/7 
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Флажки 



•Флажок OF устанавливается только в однобитных цик¬ 
лических сдвигах. Многобитные операции оставляют OF 
в неопределенном состоянии. 


Псевдокод 

Поместить первый операнд во внутренний регистр 
DO второй операнд TIMES (•раз*) 

IF направление влево THEN 
Сохранить старший бит 
ELSE 

Сохранить младший бит 
END IF 

Сдвинуть на один бит в направлении сдвига 
IF участвует CF THEN 

IF направление влево THEN 
Поместить CF в младший бит 
ELSE 

Поместить CF в старший бит 
END IF 
ELSE 

IF направление влево THEN 

Поместить сохраненный бит в младший бит 
ELSE 

Поместить сохраненный бит в старший бит 
END IF 
END IF 

Поместить сохраненный бит в CF 
ENDDO 

IF второй операнд равен 1 THEN 
IF направление влево THEN 

IF старший бит не равен CF THEN 
Установить OF в 1 
ELSE 

Сбросить OF в 0 
END IF 
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ELSE 

IF старший бит не равен соседнему THEN 
Установить OF в 1 
ELSE 

Сбросить OF в О 
END IF 
END IF 
END IF 

Сохранить внутренний регистр в первом операнде 
Операция 

В командах циклического сдвига двоичный код в 
первом операнде сдвигается влево иди вправо на число 
разрядов, определяемое вторым операндом. Биты, выдви¬ 
гаемые с одного конца операнда не теряются, как при 
сдвиге, а вводятся с другого конца операнда. 

Второй и третий символы мнемоники управляют 
особенностями сдвига. 

Третий символ задает направление сдвига: 
L — влево, R — вправо. 

Второй символ показывает значение флажка CF:0 
(чистый сдвиг) — флажок CF содержит последний вы¬ 
двинутый бит, С (сдвиг через перенос) — флажок CF 
считается частью сдвигаемого операнда. 

Второй операнд может быть непосредственным чис¬ 
лом или содержимым регистра CL. Однако допускаются 
только счетчики сдвига не более 31. Если счетчик боль¬ 
ше 31, используются только младшие 5 бит. 

Имеется также короткая форма команды для цикли¬ 
ческого сдвига на один бит. 


Особые случаи 

Режимы 

Причины 

#GP(0) 

P 


Результат в защищенном от 
записи сегменте 

#GP(0) 

P 


Недопустимый эффективный 

адрес памяти в .сегментах CS, 
DS, ES, FS, GS 

#SS(0) 

P 


Неверный адрес в сегменте SS 

#PF (fc) 

P 

V 

Страничное нарушение 

INT(13) 

R 

V 

Часть операнда вне диапазона 
адреса от 0 до OFFFFH 
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Примечания 

Одним из применений циклических сдвигов в ста¬ 
рых процессорах было ускорение умножения и деления 
в специальных случаях. Для процессора 80386 с боль¬ 
шим размером слова и быстрыми командами умножения 
и деления этого не требуется. 

Другое применение — передача бита в CF и про¬ 
верка его командами JC или JNC. Новые команды про¬ 
верки бит позволяют сделать эту операцию непосредст¬ 
венно. 


Пример 


MOV 

EAX.0CADE4956H 

; Загружает значение в 
; ЕАХ. 

STC 


; CF=1. 

RCL 

ЕАХ,3 

; EAX=56F24AB7, CF=0. 
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SAHF Сохранение АН в 
регистре флажков 
( 8086 ) 


КОП Формат Такты 

9Е SAHF 3 

Флажки 



NT 

IOPL 

OF 

DF 

IF 

TF 

SF 

ZF 


AF 


PF 


CF 

0 







S 

S 

0 

S 

0 

S 

1 

S 


Псевдокод 

Передать значение АН в младший байт регистра 
Flags. 


Операция 

Команда SAHF возвращает флажки из АН, где они 
анализировались. Она введена для совместимости с про¬ 
цессорами 8080/85 и применяется редко. 


Особые случаи 


Нет. 
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Примечания 

Эта команда применяется редко. Позволяет сразу 
задать состояние всех флажков в младшем байте реги¬ 
стра. 


Пример 

LAHF 

OR 

SAHF 


; Загружает флажки в АН. 

; PF=1. 

; Эмулирует команду «установить 
; PF». 


АН,4 
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Sxx 


Сдвиг (8086) 


коп 


Формат 

Такты 

DO 

[41 


SAL 

r/mb,l 

3/7 

D2 

[4] 


SAL 

r/mb,CL 

3/7 

СО 

[4] 

ib 

SAL 

r/mb,ib 

3/7 

D1 

[4] 


SAL 

r/mw,l 

3/7 

D3 

[4] 


SAL 

r/mw,CL 

3/7 

Cl 

[4] 

ib 

SAL 

r/mw,ib 

3/7 

D1 

[4] 


SAL 

r/md,l 

3/7 

D3 

HI 


SAL 

r/md,CL 

3/7 

Cl 

HI 

ib 

SAL 

r/md,ib 

3/7 

DO 

[7] 


SAR 

r/mb,l 

3/7 

D2 

[71 


SAR 

r/mb,CL 

3/7 

CO 

[71 

ib 

SAR 

r/mb,ib 

3/7 

D1 

[71 


SAR 

r/mw, 1 

3/7 

D3 

[7] 


SAR 

r/mw,CL 

3/7 

Cl 

[71 

ib 

SAR 

r/mw,ib 

3/7 , 

D1 

[71 


SAR 

r/md,l 

3/7 

D3 

[71 


SAR 

r/md,CL 

3/7 

Cl 

[7] 

ib 

SAR 

r/md,ib 

3/7 

DO 

[41 


SHL 

r/mb,l 

3/7 

D2 

[41 


SHL 

r/mb,CL 

3/7 

CO 

[41 

ib 

SHL 

r/mb,ib 

3/7 

D1 

HI 


SHL 

r/mw,l 

3/7 

D3 

HI 


SHL 

r/mw,CL 

3/7 

Cl 

[4] 

ib 

SHL 

r/mw,ib 

3/7 

D1 

[41 


SHL 

r/md,l 

3/7 

D3 

[4] 


SHL 

r/md,CL 

3/7 

Cl 

[4] 

ib 

SHL 

r/md,ib 

3/7 

DO 

[5] 


SHR 

r/mb,l 

3/7 

D2 

[51 


SHR 

r/mb,CL 

3/7 

CO 

[5] 

ib 

SHR 

r/mb,ib 

3/7 

D1 

[5] 


SHR 

r/mw,l 

3/7 

D3 

[51 


SHR 

r/mw,CL 

3/7 

Cl 

[5] 

ib 

SHR 

r/mw,ib 

3/7 

D1 

[51 


SHR 

r/md,l 

3/7 

D3 

15 ] 


SHR 

r/md,CL 

3/7 

Cl 

[51 

ib 

SHR 

r/md,ib 

3/7 
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Флажки 



NT 

IOPL 

OF 

DF 

* 

TF 

SF 

ZF 




PF 


CF 

0 



* 




S 

S 

0 

4 

0 

S 

1 

S 


Псевдокод 

Поместить первый операнд во внутренний регистр 
DO второй операнд TIMES (*раз*) 

IF направление влево THEN 
Поместить старший бит в CF 
ELSE 

Поместить младший бит в CF 
END IF 

Сдвинуть на один бит в направлении сдвига 
IF направление сдвига влево THEN 
Поместить 0 в младший бит 
ELSE IF команда SHR THEN 
Поместить 0 в старший бит 
ELSE (*команда SAR*) 

Поместить старый старший бит в старший бит 
END IF 
END DO 

IF второй операнд 1 THEN 

IF направление сдвига влево THEN 
IF старший бит не равен CF THEN 
Установить OF в 1 
ELSE 

Сбросить OF в О 
END IF 

ELSE IF команда SHR THEN 
Сбросить OF в О 
ELSE (^команда SAR*) 

Установить OF на старший бит 
END IF 
END IF 

Сохранить внутренний регистр в первом операнде 
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Операция 

Команды сдвига перемещают набор бит первого опе¬ 
ранда влево или вправо на число разрядов, равное вто¬ 
рому операнду. Некоторые биты исчезают с одного кон¬ 
ца операнда, а такое же число освобождающихся бит 
заполняется с другого конца операнда. Способ заполне¬ 
ния зависит от модификации команды. 

Второй и третий символы мнемоники управляют 
особенностями сдвига. 

Третий символ задает направление сдвига: 
L — влево, R — вправо. 

Второй символ определяет арифметический (А) или 
логический (Н) сдвиг. В логическом сдвиге освобождаю¬ 
щиеся биты всегда заполняются нулями. В команде SAL 
освобождающиеся справа биты заполняются нулями. В 
команде SAR освобождающиеся биты слева заполняются 
копиями значения знакового бита. 

Второй операнд может быть непосредственным зна¬ 
чением или содержимым регистра CL. Допускается счет¬ 
чик сдвига не более 31. 

Если счетчик больше 31, используются только 
младшие 5 бит. 

Имеется специальная короткая форма команды для 
счетчика сдвига 1. 


Особые случаи Режимы Причины 


#GP (0) 
#GP(0) 


#SS(0) 
#PF (fc) 
INT(13) 


P Результат в защищенном от 

записи сегменте 

Р Недопустимый эффективный 

адрес памяти в сегментах CS, 
DS, ES, FS, GS 

Р Неверный адрес в сегменте SS 

Р V Страничное нарушение 

R V Часть операнда вне диапазона 

адреса от 0 до OFFFFH 


Примечания 

В старых процессорах сдвиги использовались для ус¬ 
корения умножения и деления в специальных случаях. 
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Быстрые команды умножения и деления процессора 
80386 делают этот прием ненужным. 

Еще одно применение сдвигов — передать бит в CF 
и проверить командами JC или JNC. Новые команды 
проверки бит в процессоре 80386 осуществляют это дей¬ 
ствие проще. 


Пример 

MOV EAX.0CADE4956H ; Загружает значение в 
• ЕАХ. 

SAR ЕАХ,3 ; EAX=0F95BC92AH, 

; CF=0. 
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SHxD Сдвиг двойной 
(80386) 


КОП 



Формат 

Такі 

OF А4 

[r] 

ib 

SHLD r/mw,rw,ib 

3/7 

OF А4 

[rj 

ib 

SHLD r/md,rd,ib 

3/7 

OF А5 

[r ] 


SHLD r/mw,rw,CL 

3/7 

OF A 5 

[r ] 


SHLD r/md,rd,CL 

3/7 

OF AC 

[r ] 

ib 

SHRD r/mw,rw,ib 

3/7 

OF AC 

[r ] 

ib 

SHRD r/mtf,rd,ib 

3/7 

OF AD 

[r] 


SHRD r/mw,rw,CL 

3/7 

OF AD 

[r] 


SHRD r/md,rd,CL 

3/7 


Флажки 



NT 

IOPL 

OF 

DF 

IF 

TF 

SF 

ZF 


AF 


PF 


CF 

0 



U 



_ 

S 

S 

0 

IP 

_ 

0 

S 

1 

S 


Псевдокод 

Поместить первый операнд во внутренний регистр 
IR1 

Поместить второй операнд во внутренний регистр IR2 
DO третий операнд TIMES (*раз*) 

IF направление влево THEN 

Поместить старший бит IR2 в CF 
ELSE 

Поместить младший бит IR2 в CF 
END IF 

Сдвинуть IR2 на один бит в направлении сдвига 
Сдвинуть IR1 на один бит в направлении сдвига 
IF направление влево THEN 

Поместить CF в младший бит IR1 
ELSE 

Поместить CF в старший бит IR1 
END IF 
END DO 

Сохранить IR1 в первом операнде 




240 


Инструкции процессора 80386 


Операция 


Команды двойного сдвига перемещают набор бит 
первого операнда влево или вправо на. число разрядов, 
определяемое третьим операндом. Это действие вызывает 
удаление бит с одного конца операнда и заполнение та¬ 
кого же числа освобождающихся бит с другого конца 
операнда. Освобождающиеся биты заполняются из второ¬ 
го операнда, как будто он тоже сдвигается на то же 
число бит, и выдвигающиеся с одного конца биты вдви¬ 
гаются в первый операнд. 

Отметим, что второй операнд не изменяется. 

Третий символ мнемоники определяет направление 
сдвига: L — влево, R — вправо. Команда действует 
так, как будто операнды соединены в код двойной дли¬ 
ны и сдвигаются вместе. После этого сохраняется новое 
значение первого операнда, но второй операнд не сохра¬ 
няется. 

В команде SHLD первый операнд слева, а вто¬ 
рой — справа; в команде SHRD они считаются на 
оборот. 

Третий операнд. может быть непосредственным чис¬ 
лом или содержимым регистра CL. Допускается счетчик 
сдвига не более 31. Если он больше 31, то используют¬ 
ся только младшие 5 бит. Если размер операнда 16 бит 
(слово) и счетчик сдвига больше 15, то команда остав¬ 
ляет первый операнд и все флажки в неопределенном 
состоянии. 


Особые случаи Режимы Причины 


#GP(0) 

#GP(0) 


#SS (0) 
#PF (fc) 
INT(13) 


P Результат в защищенном от 

записи сегменте 

Р Недопустимый эффективный 

адрес памяти в сегментах CS, 
DS, ES, FS, GS 

Р Неверный адрес в сегменте SS 

Р V Страничное нарушение 

R V Часть операнда вне диапазона 

адреса от 0 до OFFFFH 



Инструкции процессора 80386 


241 


Примечания 

Команды двойного сдвига действуют как команды 
логического сдвига первого операнда на третий операнд. 
Различие в том, что освобождающиеся биты заменяются 
битами с противоположного конца второго операнда вме¬ 
сто нулей. 


Пример 


BLOCK — это смещение в текущем . сегменте 
данных, адресуемом DS, массива из LENGTH 
двойных слов, который считается одним длинным 
двоичным циклом и сдвигается влево на 10 бит 
(циклически) 


MOV EDX,BLOCK 


Сохранить пер¬ 
вое двойное сло- 


МОѴ ESI, 0 

MOV ЕСХ, LENGTH 

DEC ЕСХ 
DELOOP: 

MOV EAX,BLOCK+4 [ESI*4 J 
SHLD BLOCK [ESI*4],EAX, 10 

INC ESI 
LOOP DELOOP 


BO. 

Установить ин¬ 
дексный регистр. 
Число двойных 
слов. 

Вычесть 1. 

Следующее сло¬ 
во из массива. 
Сдвинуть теку¬ 
щее двойное 
слово, заполняя 
из следующего. 
Продвижение 
индекса. 

Повторять до 
обработки всех 
двойных слов, 
кроме последне - 


SHLD BLOCK [ESI*4],EDX, 10 


го. 

Сдвинуть по¬ 
следнее двойное 
слово, заполняя 
из первого. 
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SBB Вычитание с заемом 



( 8086 ) 


КОП 

Формат 

Так 

1C ib 

SBB AL,ib 

2 

ID iw 

SBB AX,iw 

2 

ID id 

SBB EAX.id 

2 

80 [3] ib 

SBB r/mb,ib 

2/7 

81 [3] iw 

SBB r/mw,iw 

2/7 

81 [3] id 

SBB r/md,id 

2/7 

83(31 ib 

SBB r/mw,ib 

2/7 

83(3] ib 

SBB r/md,ib 

2/7 

18[r] 

SBB r/mb,rb 

2/7 

19 [r ] 

SBB r/mw,rw 

•2/7 

19 [r ] 

SBB r/md,rd 

2/7 

lA[r ] 

SBB rb,r/mb 

2/6 

1 В [r ] 

SBB rw,r/mw 

2/6 

1В[г 1 

SBB rd,r/md 

2/6 

Флажки 





NT 

IOPL 

OF 

DF 

IF 

TF 

SF 

ZF 


AF 


PF 


CF 

0 



S 




S 

S 

E 

— 

s 

0 

S 

1 

S 


Псевдокод . 

IF (источник имеет меньше бит, чем получатель) 
THEN 

расширить источник со знаком 
END IF 

Вычесть источник из получателя. 

Вычесть CF из получателя, результат поместить в 
получатель. 
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Операция 

Команда SBB вычитает второй операнд и CF из 
первого операнда. 

Первый операнд замещается результатом, а второй 
не изменяется. 


Особые случаи Режимы Причины 


#GP(0) 

#GP(0) 


#SS(0) 

#PF(fc) 

INT(13) 


P Результат в защищенном от 

записи сегменте 

Р Недопустимый эффективный 

адрес памяти в сегментах CS, 
DS, ES, FS, GS 

Р Неверный адрес в сегменте SS 

Р V Страничное нарушение 

R V Часть операнда вне диапазона 

адреса от 0 до OFFFFH 


Примечания 


Команда SBB в основном применяется в вычитании 
длинных операндов, обеспечивая автоматический учет 
заемов. Команда SUB (см. далее) игнорирует флажок 


Пример 


MOV АХ, 1329 
MOV ВХ,373 
SUB AL,BL 

SBB АН,ВН 


; Загружает 531Н в АХ. 

; Загружает 175Н в ВХ. 

; Вычитает 75Н из 31Н, давая 
; ОВС. 

; Вычитает 1 из 5, давая 3 
; (CF-1). 

; АХ=956 (ЗВС) *разность. 




244 


Инструкции процессора 80386 


SCAS Сканирование 




массива 

(8086) 

КОП 

Формат 

Такты 

Такты 



(одиночная) 

(с повторением) 

АЕ 

SCASB 

7 

5+8 к N 

AF 

SCASW 

7 

5+8*N 

AF 

SCASD 

7 

-5+8*N 


Буква N означает число повторений. 


Флажки 



NT 

IOPL 

OF 

DF 

IF 

TF 

SF 

ZF 


AF 


PF 


CF 

И 



S 


— 

_ 


S 

S 

0 

s 


S 

1 

S 


Псевдокод 

IF размер операнда 8 бит THEN 

Вычесть ES:[(E)DI] из AL, не сохранять резуль¬ 
тат 

ELSE IF размер операнда 16 бит THEN 

Вычесть ES:[(E)DI] из АХ, не сохранять резуль¬ 
тат 

ELSE (*размер операнда 32 бита*) 

Вычесть ES:[(E)DI] из ЕАХ, не сохранять ре¬ 
зультат 

END IF 

Установить флажки по результату вычитания 
IF DF-0 THEN 

Прибавить размер операнда (в байтах) к (E)DI 
ELSE 

Вычесть размер операнда (в байтах) из (E)DI 
END IF 
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Операция 

Команда SCAS, как и CMPS, вычитает одно число 
из другого, но не сохраняет результат. Однако по ре¬ 
зультату вычитания устанавливаются и сбрасываются 
флажки. В операции участвует аккумулятор и ES: [DI ]. 
После этого корректируется DI. Инкремент или декре¬ 
мент DI зависит от состояния флажка DF. Обычно с 
командой SCAS используются префиксы REPE и 
REPNE. 


Особые случаи Режимы Причины 

#GP(0) Р Недопустимый эффективный 

адрес памяти в сегментах CS, 

DS, ES, FS, GS 

#SS(0) Р Неверный адрес в сегменте SS 

#PF(fc) Р V Страничное нарушение 

ШТ(13) R V Часть операнда вне диапазона 

адреса от 0 до OFFFFH 


Примечания 

Команда SCAS применяется для сравнения каждого 
элемента массива с заданным значением (в аккумулято¬ 
ре). Производится инициализация аккумулятора, и SCAS 
сравнивает его со значениями в массиве, начиная с 
ES: (DI ]. При использовании префикса REPNZ (или 
REPZ) сравнение продолжается до тех пор, пока символ 
будет равен (или не равен) значению в аккумуляторе. 


Пример 

STR1 DD 1,2,3,4,5 

CLD 

MOV AL,3 

LES EDI.STRl 

MOV ECX,5 

REPE SCAS В 


; Направление вперед. 
; Задает значение. 

; Задает массив. 

; Счетчик повторения. 
; Выполняется 3 раза, 
; ЕСХ=2, ES: [EDI 1 
; адресует 4. 
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SETcc Установка байта по 
условию (80386) 


коп 

Формат 

Установка условия 

0F 

97 

SETA r/mb 

Выше (CF=0 или ZF=0) 

OF 

93 

SETAE r/mb 

Выше или равно (CF=0) 

OF 

92 

SETB r/mb 

Ниже (CF=1) 

OF 

96 

SETBE r/mb 

Ниже или равно (CF=1 или 
ZF=1) 

OF 

92 

SETC r/mb 

Перенос (CF=1) 

OF 

94 

SETE r/mb 

Равно (ZF=1) 

OF 

9F 

SETG r/mb 

Больше (ZF=0 и SF=OF) 

OF 

9D 

SETGE r/mb 

Больше или равно (SF=OF) 

OF 

9C 

SETL r/mb 

Меньше (SFoOF) 

OF 

9E 

SETLE r/mb 

Меньше или равно (ZF=1 или 
SFoOF) 

OF 

96 

SETNA r/mb 

Не выше (CF=1 или ZF=1) 

OF 

92 

SETNAE r/mb 

Не выше или равно (CF=1) 

OF 

93 

SETNB r/mb 

Не ниже (CF=0) 

OF 

97 

SETNBE r/mb 

Не ниже или равно (CF=0 и 
ZF=0) 

OF 

93 

SETNC r/mb 

Нет переноса (CF=0) 

OF 

95 

SETNE r/mb 

Не равно (ZF=0) 

OF 

9E 

SETNG r/mb 

Не больше (ZF=1 или SFoOF) 

OF 

9C 

SETNGE r/mb 

Не больше или равно (SFoOF) 

OF 

9D 

SETNL r/mb 

Не меньше (SF=OF) 

OF 

9F 

SETNLE r/mb 

Не меньше или равно (ZF=0 
или SF=OF) 

OF 

91 

SETNO r/mb 

Не переполнение (OF=0) 

OF 

9B 

SETNP r/mb 

Не паритет- (PF=0) 

OF 

99 

SETNS r/mb 

Не знак (SF=0) 

OF 

95 

SETNZ r/mb 

Не нуль (ZF=0) 

OF 

90 

SETO r/mb 

Переполнение (OF=l) 

OF 

9A 

SETP r/mb 

Паритет (PF=1) 

OF 

9A 

SETPE r/mb 

Паритет четный (PF=1) 

OF 

9B 

SETPO r/mb 

Паритет нечетный (PF=0) 

OF 

98 

SETS r/mb 

Знак (SF=1) 

OF 

94 

SETZ r/mb 

Нуль (ZF=1) 

Время 

выполнения всех 

команд 4/5 тактов. 
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Флажки 



NT 

IOPL 

OF 

1 _ 

DF 

IF 

TF 

SF 

ZF 


5 


PF 


CF 

0 



г 






0 


T 


1 



Псевдокод 

IF условие установки удовлетворяется THEN 
Установить байт операнда в 1 
ELSE 

Сбросить байт операнда в О 
END IF 


Операция 

Эти команды применяются с целью сохранения те¬ 
кущего условия для использования в дальнейшем. Они 
проверяют состояние одного или нескольких флажков. 
Если условие удовлетворяется, то байт-получатель уста¬ 
навливается в 1; в противном случае он сбрасывается в 
0. Отметим, что эти команды похожи на условные пере¬ 
ходы JCC, но передачи управления не происходит. 


Особые случаи Режимы Причины 


#GP(0) 

P 

Результат в защищенном от 

#GP(0) 

P 

записи сегменте 

Недопустимый эффективный 

#SS(0) 

P 

адрес памяти в сегментах CS, 
DS, ES, FS, GS 

Неверный адрес в сегменте SS 

#PF(fc) 

P V 

Страничное нарушение 

INT(13) 

R V 

Часть операнда вне диапазона 



адреса от 0 до OFFFFH 
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Примечания 

Часть условий относится к беззнаковым числам, а 
часть к знаковым. 

Слова «выше» и «ниже» относятся к беззнаковым 
сравнениям, а «больше» и «меньше» — к знаковым. 

Из таблицы видно, что разные мнемоники дают 
один и тот же код операции (и одно проверяющее усло¬ 
вие). Избыточность объясняется тем, что одно и то же 
состояние флажков может означать разные ситуации в 
зависимости от контекста команды. Например, условная 
проверка часто применяется после команд СМР и SUB. 
Для установки подходит мнемоника SETE (установить 
при равенстве). Но сразу после команды DEC можно 
использовать тот же код операции с мнемоникой SETZ 
(установить при нуле), проверяя достижение счетчиком 
нуля. Рекомендуется тщательно выбирать мнемоники, 
чтобы они показывали смысл сравнения. 

Команды SETcc часто применяются для построения 
таблиц по результату нескольких сравнений или вычис¬ 
лений. Это удобно для разработки компиляторов и дру¬ 
гих программ, требующих обработки вложенных уровней 
условий. 

Также они применяются для вычисления булевых 
переменных. 


Пример 

MOV ЕСХ,5 ; Операнд для сравнения. 

СМР ЕСХ,7 ; Сравнивает 5 и 7. 

SETLE AL ; AL устанавливается в 1. 
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STC Установка флажка 
переноса (8086) 


КОП Формат Такты 

F9 STC 2 

Флажки 



NT 

IOPL 

OF 

DF 

IF 

TF 

SF 

ZF 


AF 

г 

PF 


CF 

0 









0 


E 


1 

1 


Псевдокод ■ 

Установить флажок CF в 1. 
Операция 

Флажок CF устанавливается в 1. 
Особые случаи 


Примечания 

Применяется для установки флажка при передаче 
параметров между программами, при подготовке к ко¬ 
мандам ADC и SBB, а также в циклических сдвигах. 

Пример 


STC ; Устанавливает CF. 
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STD Установка флажка 
направления ( 8086 ) 

КОП Формат Такты 
FD STD 2 


Флажки 



NT 

IOPL 

OF 

DF 

IF 

TF 

SF 

ZF 


AF 


PF 


CF 

0 




1 



_ 


0 

_ 

r 

T 


1 



Псевдокод 

Установить флажок DF в 1. 
Операция 

Флажок DF устанавливается в 1. 
Особые случаи 


Примечания 

Флажок DF управляет направлением циклических 
операций. Когда DF-1, после каждого повторения цик¬ 
лической операции производится декремент SI и/или DI. 
Такое «обратное» направление удобно, когда каждый 
элемент массива хранится в памяти, начиная с больших 
адресов, и цикл обрабатывается с первого символа. Де- 
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кремент применяется также, когда массив хранится 
обычным образом, но обрабатывается, начиная с послед¬ 
него символа. 


Пример 

STD ; Устанавливает DF. 
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STI Установка флажка 
разрешения 
прерываний ( 8086 ) 

КОП Формат Такты 

FB STI 3 


Флажки 



NT 

IOPL 

OF 

DF 


TF 

SF 

ZF 




PF 


CF 

0 





т 




0 

4 

0 


1 



Псевдокод 

Установить флажок IF в 1. 


Операция 

Команда STI устанавливает флажок IF в 1, разре¬ 
шая прерывания после следующей команды, если она не 
сбросит флажок IF. 

В защищенном режиме процессоров 80286 и 80386 
возникают проблемы. Команда STI может быть не вы¬ 
полнена, если текущий уровень привилегии программы, 
выполняющей STI больше (т. е. она менее привилегиро- 
вана), чем биты IOPL в регистре флажков. 


Особые случаи Режимы Причины 

#GP(0) Р Текущая привилегия больше 

IOPL 
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Примечания 

Команда STI применяется для разрешения прерыва¬ 
ний, запрещенных командой СІЛ, или в начале про¬ 
граммы для гарантированного разрешения прерываний. 

Хотя ограничения по привилегии на команду STI 
кажутся запутанными, они необходимы; если операцион¬ 
ная система разделяется во времени между несколькими 
программами, она должна иметь возможность при необ¬ 
ходимости защищать их от прерываний. 

Если ваша операционная система допускает работу 
в защищенном режиме, важно разобраться, как она об¬ 
рабатывает уровни привилегий, до попытки управлять 
прерываниями из своей программы. 


Пример 


STI ; Устанавливает IF в 1. 
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STOS Сохранение массива 
( 8086 ) 


КОП 

Формат 

Такты 

(одиночная) 

Такты 

(с повторением) 

АА 

STOSB 

4 

5+8*N 

АВ 

STOSW 

4 

5+8xN 

АВ 

STOSD 

4 

5+8 *N 

Буква N 

означает 

число повторений 

из регистра (Е)СХ. 


Флажки 



NT 

ч 

г 

OF 

DF 

- 

TF 

SF 

ZF 


AF 


PF 


CF 

0 









0 


_ 

о 


_ 

1 



Псевдокод 


IF размер операнда 8 бит THEN 

Сохранить байт из AL в байте по ES:[(E)DI] 
ELSE IF размер операнда 16 бит THEN 

Сохранить слово из АХ в слове по ES: [ (Е) DI ] 
ELSE (*размер операнда 32 бита*) 

Сохранить двойное слово из ЕАХ в двойном сло¬ 
ве по ES:[(E)DI ] 

END IF 
IF DF=0 THEN 

Прибавить размер операнда (в байтах) к (E)DI 
ELSE 

Вычесть размер операнда (в байтах) из (Е) DI 
END IF 
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Операция 

Команда STOS похожа на MOV передачи из АХ 
или АХ в ячейку памяти, адресуемую ES:DI, но и кор¬ 
ректирует DI после передачи. Если DF=0, производится 
инкремент DI, а в противном случае — декремент на 
размер операнда. 


Особые случаи Режимы Причины 

#GP(0) Р Результат в защищенном от 

записи сегменте 

#GP(0) Р Недопустимый эффективный 

адрес памяти в сегментах CS, 
DS, ES, FS, GS 

#SS(0) Р Неверный адрес в сегменте SS 

#PF(fc) Р V Страничное нарушение 

INT(13) R V Часть операнда вне диапазона 

адреса от 0 до OFFFFH 

Примечания 

Команду STOS нельзя использовать с префиксами 
REPE или REPZ, так как она не воздействует на 
флажки; указание префикса REP заставляет символ из 
AL копироваться во все элементы массива. 

Команды LODS и STOS можно использовать совме¬ 
стно для передачи массива из DS в ES с любыми ус¬ 
ловными проверками или изменениями между LODS и 
STOS. Для передачи массива без изменений эффектив¬ 
нее применять команду MOVS. 

Пример 


CLD 


; Направление вперед. 

XOR 

ЕАХ,ЕАХ 

; Сбрасывает ЕАХ. 

LES 

EDI,BIGARRAY 

; Адрес массива-получате- 

MOV 

ЕСХДООО 

; Счетчик повторений. 

REP 

STOSD 

; Передача 1000 двойных 


; слов из нулей. 
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SUB 

Вычитание (8086) 

коп 

Формат 

Такты 

2С ib 

SUB AL,ib 

2 

2D iw 

SUB AX,iw 

2 

2D id 

SUB EAX,id 

2 

80 [5] ib 

SUB r/mb,ib 

2/7 

81 [5] iw 

SUB r/mw,iw 

2/7 

81 [5] id 

SUB r/md,id 

2/7 

83 [5] ib 

SUB r/mw,ib 

2/7 

83 15] ib 

SUB r/md,ib 

2/7» 

28 [r] 

SUB r/mb,rb 

2/7 

29 [r] 

SUB r/mw,rw 

2/7 

29 [r] 

SUB r/md,rd 

2/7 

2A [r] 

SUB rb,r/mb 

2/6 

2B [r] 

SUB rw,r/mw 

2/6 

2B [r] 

SUB rd,r/md 

2/6 

Флажки 





NT 

IOPL 

OF 

DF 

IF 

TF 

SF 

ZF 


AF 


PF 


CF 

0 



S 




S 

S 

0 

S 

0 

S 

Г 1 

S 


Псевдокод 

IF (источник короче получателя) THEN 
расширить источник со знаком 
END IF 

Вычесть источник из получателя, поместить резуль¬ 
тат в получатель 

Операция 

Команда SUB вычитает второй операнд из первого. 
Первый операнд замещается результатом, а второй опе¬ 
ранд не изменяется. 




Инструкции процессора 80386 


257 


Особые случаи Режимы Причины 

#GP(0) Р Результат в защищенном от 

записи сегменте 

#GP(0) Р Недопустимый эффективный 

адрес памяти в сегментах CS, 
DS, ES, FS, GS 

#SS(0) Р Неверный адрес в сегменте SS 

#PF(fc) Р V Страничное нарушение 

INTG3) R V Часть операнда вне диапазона 

адреса от 0 до OFFFFH 


Примечания 

Команда SUB применяется в простом вычитании, а 
для вычитания чисел кратной точности требуется коман¬ 
да SBB (учитывающая заемы). 

Важно понимать, как команда SUB воздействует на 
флажки, так как после нее применяется условный пере¬ 
ход. 


Пример 

MOV АХ, 1329 ; Загружает 531Н в АХ. 

MOV ВХ,373 ; Загружает 175Н в ВХ. 

SUB АХ,ВХ ; АХ=956(ЗВСН). 


9 Зак 
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TEST Логическое 

сравнение (8086) 


КОП 


Формат 

Такт 

А8 

ib 


TEST AL,ib 

2 

А9 

iw 


TEST AX.iw 

2 

А9 

id 


TEST EAX.id 
TEST r/mb,ib 

2 

F6 

[4] 

ib 

2/5 

F7 

[4] 

iw 

TEST r/mw,iw 

2/5 

F7 

[4] 

id 

TEST r/md,id 

2/5 

84 

[г] 


TEST r/mb.rb 

2/5 

85 

[г] 


TEST r/mw,rw 

2/5 

85 

[г] 


TEST r/md.rd 

2/5 

84 

[г] 


TEST rb,r/mb 

2/5 

85 

[г] 


TEST rw,r/mw 

2/5 

85 

[г] 


TEST rd,r/md 

2/5 


Флажки 



NT 

IOPL 

OF 

DF 

IF 

TF 

SF 

ZF 


AF 


PF 


CF 

0 



0 




S 

S 

0 


0 

S 

1 

0 


Псевдокод 

REPEAT 

IF бит получателя равен 1 и соответствующий 
бит источника равен 1 THEN 
установить бит в результате (внутри 80386) в 1 
ELSE 

сбросить бит в результате (внутри 80386) в 0 
END IF 

UNTIL проверки всех бит операндов 
Установить флажки по результату 
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Операция 

Команда TEST выполняет логическую функцию И 
над операндами, но нигде не сохраняет результат. Ито¬ 
гом команды являются состояния флажков. 

Операнды команды TEST должны иметь одинаковый 
размер. 


Особые случаи Режимы Причины 

#GP(0) Р Недопустимый эффективный 

адрес памяти в сегментах CS, 

DS, ES, FS, GS 

#SS(0) Р Неверный адрес в сегменте SS 

#PF(fc) Р V Страничное нарушение 

INTG3) R V Часть операнда вне диапазона 

адреса от 0 до OFFFFH 


Примечания 

Команда TEST, часто применяется для проверки 
единичного состояния одного бита. Для этого число 
сравнивается с непосредственным значением, в котором 
нужный бит установлен. О результате проверки сигнали¬ 
зирует ZF (ZF=0, если бит сброшен). Новые команды 
проверки бит в процессоре 80386 осуществляют эту опе¬ 
рацию проще, но несколько дольше (3 такта вместо 
двух). 


Пример 

MOV АХ,9563Н ; Загружает число в АХ. 

TEST АХ,0С6А5Н ; SF=1, ZF=0, PF=1. 
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WAIT Ожидание 

сопроцессора (8086) 

КОП Формат Такты 

9В WAIT 6* 

*Это минимальное значение при условии, что сигнал 
BUSY уже пассивный. 


Флажки 



NT 

IOPL 

OF 

DF 

IF 

TF 

SF 

ZF 


AF 


PF 


CF 

0 









0 

_ 

1 

0 


1 



Псевдокод 

WHILE пока сигнал BUSY активный DO 
ENDDO 


Операция 

Команда WAIT применяется для синхронизации 
процессора 80386 с сопроцессорами 80287 или 40387. 
Эти сопроцессоры ускоряют численные расчеты, особенно 
с плавающей точкой, работая параллельно с 80386. Ког¬ 
да программе процессора 80386 нужен результат этих 
расчетов, он должен ожидать окончания операции сопро¬ 
цессора. Когда сопроцессор работает, он формирует ак¬ 
тивный сигнал BUSY, а по завершении операции сигнал 
становится пассивным. Команда WAIT при пассивном 
сигнале ничего не делает, а выполнение переходит к 
следующей команде. Программе процессора 80386 гаран¬ 
тируется получение нужного результата. 
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Особые случаи Режимы Причины 

#NM Р R V Установлен флажок переклю¬ 

чения задачи в слове состоя¬ 
ния машины 

#MF Р R V Сигнал ERROR# (незамаскиро¬ 

ванная численная ошибка) 


Примечания 

Команды сопроцессора в данной книге не рассмат¬ 
риваются, но команда WAIT приведена, потому что она 
управляет процессором 80386, а не сопроцессором. 


Пример 


WAIT ; Ожидает окончания операции сопроцессора. 
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XCHG 

Обмен 

(80 

коп 

Формат 

Так' 

•90+г 

XCHG AX,rw 

3 

90+г 

XCHG rw,AX 

3 

90+г 

XCHG EAX,rd 

3 

90+г 

XCHG rd,EAX 

3 

86 [г] 

XCHG rb,r/mb 

3/5 

86 [г] 

XCHG r/mb,rb 

3/5 

87 [г] 

XCHG rw,r/mw 

3/5 

87 [г] 

XCHG r/mw,rw 

3/5 

87 [г] 

XCHG rd,r/md 

3/5 

87 [г] 

XCHG r/md,rd 

3/5 

Флажки 





NT 

IOPL 

OF 

DF 

IF 

TF 

SF 

ZF 


AF 


PF 


CF 

0 









0 

_ 

1 

IT 


1 

L 


Псевдокод 

Передать содержимое получателя во внутренний ре¬ 
гистр. 

Заменить получатель операндом-источником. 
Заменить источник операндом-получателем (из внут¬ 
реннего регистра). 


Операция 

Команда XCHG обменивает содержимое двух опе¬ 
рандов в одной команде. Без нее для этой функции по¬ 
требовалось бы три команды MOV (и регистр) или ко¬ 
манда PUSH, MOV, POP. При выполнении этой коман- 
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ды всегда передается сигнал блокировки шины LOCK. 
Следовательно,' передачу данных не может прервать дру¬ 
гое устройство, использующее системную шину. 


Особые случаи Режимы Причины 


#GP(0) 


#GP(0) 


#SS(0) 

#PF(fc) 

INT(13) 


P Минимум один из операндов в 

защищенном от записи сег¬ 
менте 

Р Недопустимый эффективный 

адрес памяти в сегментах CS, 
DS, ES, FS, GS 

Р Неверный адрес в сегменте SS 

Р V Страничное нарушение 

R V Часть операнда вне диапазона 

адреса от 0 до OFFFFH 


Примечания 

Главное назначение команды XCHG — обеспечить 
взаимодействие процессов. Так как команда XCHG всег¬ 
да блокируется, каждый из двух независимых процессов 
(возможно на разных процессорах) может использовать 
ее для доступа к разделенной переменной, не заботясь о 
конфликтах. Пусть две задачи должны обращаться к од¬ 
ному выходному буферу. Можно выделить слово для 
флажка о доступности буфера: 0=буфер свободен, 1=одна 
из задач использует буфер. До загрузки в буфер данных 
каждая задача должна сначала поместить 1 в регистр, 
обменять его с флажком буфера и проверить регистр на 
нуль. Если регистр нулевой, задача может безопасно ис¬ 
пользовать буфер, зная, что флажок буфера содержит 1 
и другая задача не попытается использовать буфер. Если 
бы команда XCHG не блокировалась, возможна ситуа¬ 
ция, когда обе задачи полагают о возможности безопас¬ 
ного доступа к буферу. После окончания работы с буфе¬ 
ром задача должна поместить во флажок нуль. 

Во многих алгоритмах сортировки требуется обмен 
неверно размещенных элементов. С помощью команды 
XCHG число требуемых команд сокращается с четырех 
до трех, и нужен один регистр, а не два. Этот способ 
поясняет следующий пример. 
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Пример 

XCHG AX.DATA1 ; АХ содержит DATA1 и нао- 
; борот. 

XCHG AX.DATA2 ; В DATA2 теперь DATA1, а в 
; АХ находится DATA2. 

XCHG AX.DATA1 ; В АХ исходное значение, а в 
; DATA1 находится DATA2. 
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XLAT Табличное 

преобразование 

( 8086 ) 


КОП 

Формат 

Такты 

D7 

XLAT 

5 

Флажки 





NT 

IOPL 

о? 

DF 

IF 

TF 

- 

ZF 


AF 


PF 


CF 

_ 

Т 









0 


_ 

o\ 


1 



Псевдокод 

Передать байт из DS: [ (Е) ВХ+беззнаковое AL] в AL. 


Операция 

Команда XLAT применяется для преобразования ин¬ 
декса таблицы в табличное значение. Она действует 
только с таблицами байт, имеющими 256 байт или ме¬ 
нее. Базовый адрес таблицы находится в (Е)ВХ, а ин¬ 
декс в AL. Команда передает адресуемый байт в AL. 


Особые случаи Режимы Причины 


#GP (0) 


#SS(0) 
#PF (fc) 
INT(13) 


P Недопустимый эффективный 

адрес памяти в сегментах CS, 

DS, ES, FS, GS 

Р Неверный адрес в сегменте SS 

Р V Страничное нарушение 

R V Часть операнда вне диапазона 

адреса от 0 до OFFFFH 
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Примечания 

Обычно команда XLAT применяется для преобразо¬ 
вания из одного символьного кода в другой. Програм¬ 
мист создает 256-байтную таблицу нужного кода, а ко¬ 
манда XLAT осуществляет простое и быстрое преобразо¬ 
вание. 

Команда XLAT часто применяется для «классифика¬ 
ции символов», которое требуется в компиляторах, ас¬ 
семблерах и других программах, на входе которых есть 
интерпретируемая символьная таблица. Таблица для 
XLAT содержит коды классификации символов: 

1-все прописные буквы, 2-все строчные буквы, 
3-цифры и т. д. 

Команда XLAT и несколько простых команд сравне¬ 
ний и условных переходов легко определяют тип симво¬ 
ла и выполняют необходимую обработку. 

Как альтернативу можно использовать таблицу пе¬ 
реходов. 


Пример 


TABLE25 DB 0,25,50,75,100,125,150,175,200,225,250 
; кратные 25. 


CMP AL,10 
JA TOOBIG 
LDS BX.TABLE25 

XLAT 


; Кратные до 10. 

; Переход, вне диапазона. 
; Адрес таблицы для 
; XLAT. 

; Быстрое умножение на 
; 25 малых чисел. 
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XOR Исключающее ИЛИ 



( 8086 ) 


КОП 

Формат 

Так' 

34 ib 

XOR AL,ib 

2 

35 iw 

XOR AX,iw 

2 

35 id 

XOR EAX.id 

2 

80 [6] ib 

XOR r/mb,ib 

2/7 

81 [6] iw 

XOR r/mw,iw 

2/7 

81 [6] id 

XOR r/md,id 

2/7 

30 [r] 

XOR r/mb,rb 

2/7 

31 [r] 

XOR r/mw,rw 

2/7 

31 [r] 

XOR r/md,rd 

2/7 

32 [r] 

XOR rb,r/mb 

2/6 

33 [r] 

XOR rw,r/mw 

2/6 

33 [r] 

XOR rd,r/md 

2/6 

Флажки 





NT 

Cl, 

О 

OF 

DF 

, F 

TF 

SF 

ZF 


AF 


PF 


CF 

0 



0 




Г 

S 

0 


0 

S 

1 

0 


Псевдокод 

REPEAT 

IF если бит в получателе совпадает с соответст¬ 
вующим битом получателя THEN 
сбросить в 0 бит получателя 
ELSE 

установить в 1 бит получателя 
END IF 

UNTIL до проверки всех бит в получателе 
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Операция 

Команда XOR выполняет логическую функцию Иск¬ 
лючающего ИЛИ над двумя операндами и помещает ре¬ 
зультат в первый операнд (см. табл. 4.1). 

Размеры операндов в команде XOR должны быть 
одинаковыми. 


Особые случаи 

Режимы 

Причины 

#GP (0) 

P 

Результат в защищенном от 



записи сегменте 

#GP(0) 

P 

Недопустимый эффективный 

адрес памяти в сегментах CS, 
DS, ES, FS, GS 

#SS(0) 

P 

Неверный адрес в сегменте SS 

#PF (fc) 

P V 

Страничное нарушение 

INT(13) 

R V 

Часть операнда вне диапазона 
адреса от 0 до OFFFFH 

Примечания 




Команда XOR применяется для реализации функций 
проверки и сравнения бит, многие из которых проще 
реализуются новыми командами манипуляций битами 
процессора 80386. 


Пример 


MOV АХ.5963Н ; Загружает число в АХ. 

XOR АХ.6СА5Н ; АХ-35С6Н; SF=0, ZF=0, PF-1. 



Глава 5 


ЗАЩИЩЕННЫЙ РЕЖИМ 


При разработке программ для 80386 прикладные 
программисты сталкиваются с проблемой выбора. С од¬ 
ной стороны, программы для 8086 прямо выполняются 
на новом процессоре, и программисту можно не изучать 
ничего нового. Однако в защищенном режиме работы 
процессоров 80286/386 имеется множество новых воз¬ 
можностей. Они изменяют ту среду, в которой будут 
выполняться даже простейшие программы. 

В данной главе поясняется смысл таких понятий, 
как задачи, сегменты и страницы. Конечно, после изу¬ 
чения ее вы не превратитесь сразу в системного про¬ 
граммиста, но разберетесь в возможностях и ограничени¬ 
ях систем с процессором 80386. 


5г1. МУЛЬТИЗАДАЧНОСТЬ 

Слово «задача» часто применяется для описания 
всего того, что может делать компьютер. Важно пони¬ 
мать сущность задачи в любом компьютере и особенно¬ 
сти ее реализации процессором 80386. Этот процессор 
позволяет разработчику операционной системы реализо¬ 
вать несколько задач одновременно, а отдельную при¬ 
кладную программу как бы выполнять на простом одно¬ 
задачном компьютере. 

Пусть два процессора А и В разделяют общую об¬ 
ласть памяти, но выполняют две совершенно разные 
программы. Предположим, что мы хотим обменять про¬ 
граммы, выполняющиеся на этих процессорах. Что нуж¬ 
но для этого сделать? 
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Состояние компьютера на базе 80386 в любой 
момент времени можно описать содержимым ре¬ 
гистров. Они показывают, какая команда выполняется, 
к каким данным в памяти происходит обращение, 
и содержат другую используемую процессором инфор¬ 
мацию. 

Следовательно, нам нужно обменять содержимое ре¬ 
гистров процессоров. В процессор А передается содержи¬ 
мое сегментных регистров, указателя команды и других 
регистров процессора В, а в процессор В соответствую¬ 
щие данные от процессора А. Учтем также содержимое 
регистра флажков, и проблема решена — задания про¬ 
цессоров обменялись. 

Такой обмен очень похож на «переключение зада¬ 
чи» в процессоре 80386. Так как есть только один про¬ 
цессор, то программа использует ресурсы всей системы. 
После того, как программе дается сигнал «освободить 

микросхему», она сохраняет содержимое всех своих реги¬ 
стров в области памяти, называемой сегментом состоя¬ 
ния задачи TSS, который содержит копии всех регистров 
и другую информацию. Регистры перезагружаются из 
TSS программы, которой передается управление. После 
этого выполняется новая программа, а старая ожидает 
вызова. 

Такое представление помогает понять смысл муль¬ 
тизадачное™ в 80386. Мультизадачность не обязатель 
но подразумевает несколько пользователей; даже 
одна программа, например, текстовый процессор, 

может запустить задачу типа буферизации печати 
и отменить ее, когда печать закончена; при этом 
задача-потомок скрыта от пользователя. Однополь¬ 

зовательская мультизадачная система может иметь 
операционную систему (OS), которая управляет 

несколькими программами, выполняющимися 

одновременно как отдельные задачи; пользователь 
может назначать им приоритеты и переключать их по 
своему желанию. 

Задачу можно считать также выполняющейся про¬ 
граммой или OS, которые в свою очередь управляются 
«гипервизором». Так реализован режим виртуального 
8086 (см. гл. 6). Гипервизор может иметь прикладные 
программы 80386, выполняющиеся прямо под ним, а 
также несколько прикладных программ и OS 8086, при¬ 
чем программы никогда не «знают» о том, что они пе¬ 
реключаются. 
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Многопользовательские системы можно реализовать, 
позволяя каждому пользователю работать в качестве от¬ 
дельной задачи (в любой из приведенных выше форм). 
Процессор переключается между задачами так быстро, 
что у каждого пользователя создается иллюзия моно¬ 
польного владения компьютером. Можно также позво¬ 
лить каждому пользователю реализовать мультизадач- 
ность на его терминале, но это может привести к пере¬ 
грузке процессора. Число одновременно выполняющихся 
задач без заметного конфликтования зависит от типа 
жесткого диска, памяти и других периферийных уст¬ 
ройств, а также от времени, занимаемого каждой зада¬ 
чей. 


5.1.1. Поддержка мультизаданности в 80386 

Несколько структур данных, хранимых в стандарт¬ 
ной форме для быстрой обработки, управляются процес¬ 
сором и специальным регистром задачи TR, адресующим 
текущую задачу. Благодаря этому процессор может пе¬ 
реключаться с одной задачи на другую за 268 тактов 
(17 микросекунд при 16 МГц), что соответствует почти 
60000 переключений в секунду, если задачи не занима¬ 
ют время. Следовательно, ежесекундно можно делать 
множество переключений задач, оставляя достаточно 
времени и на выполнение программ. 

Ниже приведены программные структуры. 

1. Специальный сегмент состояния задачи TSS име¬ 

ет минимум 26 двойных слов. Он имеет место 
для копий всех регистров 80386, включая 
EFlags, ЕІР и другие. Он также содержит 16- 
битный указатель предыдущего TSS, который 
нужен при возврате. Указатель полезен, когда 
подчиненная задача (например, обработчик пре¬ 
рывания) вызвана другой задачей и должна 
при окончании возвратить управление вызываю¬ 
щей задаче. 

2. Имеется также специальный дескриптор TSS. Все 

сегменты имеют дескрипторы, дающие необхо¬ 
димую информацию о задаче (местоположение, 
размер и уровень привилегий). Для дескриптора 
TSS длина должна быть не менее 103 байт 
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(104 при использовании карты разрешения вво¬ 
да/вывода; ее размер хранится в последнем 
слове TSS). Допускается использование TSS 
большего размера, и пользователь сам опреде¬ 
ляет значения в дополнительных байтах. Отме¬ 
тим, что TSS не является реентрантным; если 
задача занята (показывает бит Busy в дескрип¬ 
торе TSS), вновь ее запустить нельзя. 

3. Имеется также дескриптор шлюза задачи. Это 
короткая структура данных, которая разрешает 
доступ к TSS (другие шлюзы допускают доступ 
к другим структурам данных). Формат дескрип¬ 
тора шлюза задачи показан на рис. 5.1. 


31_23_15_7_0 


не используются 

Р DPL 0 0 10 1 

не 

используются 

СЕЛЕКТОР 

не используются 


Рис. 5.1. Дескриптор шлюза задачи 

Поле DPL задает уровень привилегий шлюза 
задачи. Процедура, которая обращается к шлю¬ 
зу задачи, должна иметь уровень привилегий 
не больше уровня привилегий шлюза задачи. 
Если доступ разрешается, селектор допускает 
обращение к TSS без дальнейшего контроля за¬ 
щиты. Это значит, что процедура, которая не 
может прямо обратиться к данному TSS, может 
достигнуть его через шлюз задачи. В отличие 
от TSS дескриптор шлюза задачи может нахо¬ 
диться в локальной таблице данных и «видим» 
некоторым процедурам (включая обработчики 
прерываний), но не всем. Этим обеспечивается 
гибкий доступ к задаче, которая может иметь 
несколько шлюзов, каждый из которых досту¬ 
пен разным процедурам и имеет различные 
уровни привилегий, но все они разделяют одно 
и тоже поле селектора. 

Помимо программных структур к мультизадачное™ 
относится регистр задачи TR. Он похож на айсберг, так 
как большая часть его невидима. Видимую часть состав¬ 
ляют старшие 16 бит; они содержат селектор, который 
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адресует дескриптор текущего TSS. Скрытая часть содер¬ 
жит 16-битную базу TSS и 16-битный ограничитель 
TSS. Сегмент TSS действует как внутренняя кэш-па¬ 
мять, поэтому к этим полям можно обращаться быстро, 
когда программа обращается к текущему TSS. Переклю¬ 
чение задачи происходит, когда команда JMP или CALL 
обращается к дескриптору TSS или шлюзу задачи, когда 
прерывание адресует шлюз задачи или когда текущая 
задача выполняет команду IRET и установлен флажок 
NT (вложенная задача). В последнем случае для быст¬ 
рого возвращения в вызывающую задачу применяется 
указатель предыдущего TSS, хранимый в текущем TSS. 

Осуществляется несколько проверок уровня привиле¬ 
гий и наличия в памяти текущее TSS (если его нет, 
возникает особый случай прерывания). Если проверки 
отвечают условиям, регистры текущей задачи сохраняют¬ 
ся в текущем TSS. После этого в TR загружается се¬ 
лектор нового TSS, и в регистры помещается информа¬ 
ция из нового TSS. Наконец, устанавливается бит TS 
(задача переключена) в слове состояния машины, изве¬ 
щая сопроцессоры о происшедшем изменении. 


5.2. СЕГМЕНТАЦИЯ 

Сегменты — это отдельные логические блоки памя¬ 
ти со своими размером, уровнем защиты и другими ха¬ 
рактеристиками, но сегменты могут перекрываться и да¬ 
же быть одной областью памяти (это называется альтер¬ 
нативным именованием). Процессор 80386 одновременно 
обращается к шести сегментам, адресуемым своими 16- 
битными регистрами. Регистры CS, DS и SS определяют 
начальные адреса сегментов кода, данных и стека. Реги¬ 
стры ES, FS u GS определяют начальные адреса трех 
дополнительных сегментов. Каждый из сегментов имеет 
дескриптор сегмента, содержащий информацию о защите 
и размере. 

В процессорах 8086/88 размер сегментов ограничен 
64 Кбайтами. Это означает, что большинство выполняю¬ 
щихся программ требуют отдельных сегментов для кода, 
данных и стека, а средние и большие программы долж¬ 
ны иметь доступ к нескольким сегментам для кода, дан¬ 
ных и стека. Большие структуры данных разделяются на 
части границами сегментов. 
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Процессор 80386 допускает использование сегментов 
до 4 Гбайт, что обеспечивает более гибкое управление 
памятью. Однако структура памяти в основном опреде¬ 
ляется OS. Операционная система 8086 (или любая про¬ 
грамма реального режима 80386 или режима виртуаль¬ 
ного 8086), выполняющаяся на 80386, будет накладывать 
точно те же ограничения, что и в предыдущем поколе¬ 
нии процессора. OS 80386 накладывает такие ограниче¬ 
ния ради совместимости с имеющимся кодом или упро¬ 
щения своей работы. 

Далее рассматриваются потенциальные возможности 
80386. 

Отметим, что 80386 может поддерживать полностью 
несегментированную и незащищенную модель памя¬ 
ти. Если установить все сегменты регистра на 
нуль, придать каждому сегменту предел 4 Гбайта и 
уровень защиты 3 (нет защиты), то указатель ко¬ 
манды, база стека, указатель индекса V указатель 
данных будут обращаться к одной и той же об¬ 
ласти 4 Гбайта и в известном смысле будут взаимо¬ 
заменяемы. Это необязательно для всех при¬ 
кладных применений, но позволяет прямо перено¬ 
сить на системы 80386 OS типа UNIX (которая 
обычно использует плоскую модель памяти). 


5.2.1. Формирование линейного адреса 

В большинстве прикладных программ для обращения 
к памяти используется несколько режимов адресации. 
Они определяют окончательное значение смещения, ко¬ 
торое называется эффективным адресом операнда в па¬ 
мяти. Смещение объединяется с соответствующим регист¬ 
ром базы сегмента и образует линейный адрес. Если 
страничная организация заблокирована, линейный адрес 
применяется для прямого доступа к памяти. 

В реальном режиме содержимое сегментного регист¬ 
ра просто умножается на 16 (сдвиг влево на 4 разряда) 
и суммируется с младшими 16 битами эффективного ад¬ 
реса; в результате получается 20-битный адрес, как в 
8086 или в реальном режиме 80286. Этот же прием ис¬ 
пользуется для задач, выполняющихся в режиме вирту¬ 
ального 8086. В защищенном режиме линейные адреса 
могут иметь 32 бита, адресуя память до 4 Гбайт. 
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Фактическая длина сегментных регистров 64 бита, 
но программы «видят» только старшие 16 бит. 64-бит¬ 
ный элемент содержит всю информацию о сегменте и 
называется дескриптором сегмента. Он имеет фактиче¬ 
скую базу сегмента до 32 бит, адресующую память 
4 Гбайта (линейное адресное пространство). Линейный 
адрес получается при суммировании базы сегмента и 
эффективного адреса (сдвиг не производится). 

Регистры в процессоре содержат дескрипторы тех 
сегментов, которые использует текущая выполняющаяся 
задача. Однако программа 80386 может иметь много сег¬ 
ментов, а сам процессор может выполнять несколько за¬ 
дач одновременно. Дескрипторы сегментов в регист¬ 
рах — это просто быстродоступные копии дескрипторов 
сегментов, хранимых в памяти. 


5.2.2. Дескрипторы сегментов и таблицы 

На рис. 5.2 показан формат дескриптора сегмента. 
Поля в дескрипторе интерпретируются по-разному для 
разных типов дескрипторов; ниже описаны поля для сег¬ 
ментов кода и данных. 


31 

23 

15 7 

0 

База 

31 ... 24 

G 0О AVL Предел 
19 ... 16 

Р DPL 1 Тип А 

База 

23 ... 16 

База 

15... 0 

vsrs 


Рис. 5.2. Дескриптор сегмента 


Другие типы сегментов аналогичны. 

1. БАЗА. База сегмента длиной 32 бита находится 

в трех частях дескриптора. 

2. ГРАНИЦА. Эта 20-битная величина находится в 

двух частях дескриптора. Обычно такую вели¬ 
чину можно использовать для адресации памя¬ 
ти только 1 Мбайт, что ограничивает длину 
сегментов до 1 Мбайт, если бы не было 
бита G. 

3. ГРАНУЛЯРНОСТЬ (G). Когда G=0, максималь¬ 

ный размер границы равен 1 Мбайту, но если 
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G=l, то размер умножается на 4 К (размер 
страницы). Теперь граница означает не только 
длину сегмента, но и то, что его длина может 
определяться заданным числом страниц. Это оз¬ 
начает, что границу можно проконтролировать 
только до ближайшей к концу сегмента страни¬ 
цы. 

4. ДОСТУПНОСТЬ (AVL). Этот бит определяет, 

доступен ли дескриптор для использования OS. 

5. ПРИСУТСТВИЕ (Р). Этот бит показывает, нахо¬ 

дится ли сегмент в памяти. Бит содержит 1 и 
сегмент недоступен, если применяется сегмент¬ 
ная виртуальная память и сегмент передан на 
диск или в другое пространство, не отображае¬ 
мое страничным устройством. 

6. УРОВЕНЬ ПРИВИЛЕГИЙ ДЕСКРИПТОРА 

(DPL). Два бита показывают уровень привиле¬ 
гий, необходимый для доступа от 0 (высший) 
до 3. 

7. ТИП (TYPE). Это 4-битное поле используется 

по-разному в дескрипторах разных типов. На¬ 
пример, оно может определять, что сегмент яв¬ 
ляется исполняемым, считываемым и/или запи¬ 
сываемым. Для сегментов OS это поле может 
определять тип дескриптора вида LDT, TSS 
или шлюз (последние два имеют свои подти¬ 
пы). 

8. ОБРАЩЕНИЕ (А). Этот бит устанавливается, 

когда дескриптор загружается в сегментный ре¬ 
гистр. 

Дескрипторы создаются и управляются OS и други¬ 
ми системными программами типа компиляторов. Все 
эти программы должны работать согласовано, обеспечи¬ 
вая правильную модификацию дескрипторов. 

Все дескрипторы хранятся в памяти в виде таблиц. 
Длина таблиц может достигать 8192 (2 13 ) дескрипторов. 
Изменяется только глобальная дескрипторная таблица 
GDT; она содержит дескрипторы сегментов, доступные 
любой задаче с достаточно высоким уровнем привилегий 
для обращения к сегменту прямо или через шлюз. Каж¬ 
дая задача имеет также локальную дескрипторную таб¬ 
лицу LDT, которая описывает сегменты, доступные толь¬ 
ко данной задаче; обычно эти сегменты включают в се¬ 
бя код и данные задачи. Однако две задачи могут раз- 
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делять часть или всю LDT. Например, текстовый про¬ 
цессор, создающий отдельную задачу для управления пе¬ 
чатью, может разрешить новой задаче доступ к необхо¬ 
димым ей коду и данным. 

Одним из интересных моментов, связанных с де¬ 
скрипторами сегментов, является альтернативное имено¬ 
вание. Когда два или более дескрипторов именуют час¬ 
тично или полностью перекрывающиеся части линейного 
адресного пространства, они «подменяют» (как псевдони¬ 
мы) друг друга. Например, дескриптор для сегмента ко¬ 
да может определять, что код считываемый, но не. запи¬ 
сываемый. Альтернативный дескриптор сегмента может 
определять, что та же область является записываемой; 
такой псевдоним можно использовать (намеренно или 
случайно) для изменения или перезаписи кода. OS дол¬ 
жна следить за альтернативными именами; если OS хо¬ 
чет удалить сегмент, она должна удалить или изменить 
все дескрипторы, которые обеспечивают доступ к этой 
области памяти. 


5.3. СТРАНИЧНАЯ ОРГАНИЗАЦИЯ 

Страничная организация — это одна из наиболее 
интересных и новых возможностей 80386, но она пред¬ 
назначена только для OS. Если прикладной программист 
имеет доступ к части сегментных регистров, которые уп¬ 
равляют сегментной адресацией, то страничная организа¬ 
ция от него скрыта. Ничего подобного нет в процессо¬ 
рах 8086 и 80286. Но все же целесообразно разобраться 
в страничной организации. По-видимому, она будет ос¬ 
новным средством доступа к большой реальной памяти и 
Очень важна для работы виртуального режима, который 
будет основой мультизадачных систем и гигантских при¬ 
кладных программ будущего. Можно понять идеи стра¬ 
ничной организации и не разрабатывая OS. Для боль¬ 
шинства программистов достаточно информации приводи¬ 
мой далее и сведений о конкретной OS. 

Страница памяти процессора 80386 — это блок па¬ 
мяти размером 4 Кбайта (страничные кадры). Адреса 
страничных кадров 0, 4К, 8К и т. д. Любой элемент 
данных, который начинается по любому из этих адре¬ 
сов, называется «выравненным по границе страницы». 
Адресация страничного кадра в линейном адресном про- 
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странстве 4 Гбайта упрощается, так как нужен толь¬ 
ко 20-битный адрес; последние 12 бит адре¬ 
са из 32 — нулевые. В виртуальной памяти 
по мере необходимости производится обмен стра¬ 
ницами между памятью и диском. Секции на дис¬ 
ке по 4 Кбайта для хранения страниц называются 
страничными слотами. 

Разрешением и запрещением страничной организа¬ 
ции управляет бит в слове состояния. Страничная орга¬ 
низация нужна системным программистам, так как она 
обеспечивает простое назначение почти любого физиче¬ 
ского адреса для замены сформированного программой 
линейного адреса. Следовательно, страничная организа¬ 
ция обязательна для OS. 

Допускается работать только со страницами без 
сегментов, поместив все в один большой сегмент. 
Сегменты имеют свои достоинства, особенно для 
защиты всего кода или фрагментов данных. По-ви- 
димому, общая модель памяти будет использо¬ 
вать сегменты для защиты на уровне сегментов и 
страничную организацию для переотображения 
памяти и виртуальной памяти. 

5.3.1. Формирование физического адреса 

Физический адрес — это адрес, который формирует 
страничное устройство. Когда страничная организация 
блокирована (и во многих других случаях), входной ли¬ 
нейный адрес совпадает с выходным физическим адре¬ 
сом. Хотя процесс преобразования применяется не всег¬ 
да, следует разобраться в том, как он работает. 

Физический адрес состоит из трех частей (см. 
рис. 5.3): 10-битный элемент DIR, 10-битный элемент 
PAGE (страница) и 12-битное OFFSET (смещение). 
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Рис. 5.3. Элемент каталога страниц/элемент таблицы страниц 


Эти три поля используются для образования физи¬ 
ческого адреса следующим образом. 
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1. 32-битный регистр CR3 содержит адрес текущего 

каталога страниц. Младшие 12 бит CR3 содер¬ 
жат нули, так как каталог страниц всегда на¬ 
чинается на границе страниц. 10-битное значе¬ 
ние DIR из линейного адреса показывает нуж¬ 
ный элемент каталога страниц. 

2. Старшие 20 бит элемента каталога страниц адре¬ 

суют таблицу страниц; полный физический ад¬ 
рес таблицы, выравненной по границе страни¬ 
цы, получается присоединением 12-ти младших 
нулей. 10-битное значение PAGE из середины 
линейного адреса показывает нужный элемент 
таблицы страниц. 

3. Старшие 20 бит элемента таблицы страниц адре¬ 

суют страничный кадр; для получения полного 
линейного адреса присоединяются 12 младших 
нулей. 12-битное значение OFFSET из млад¬ 
ших бит линейного адреса адресует нужную 
ячейку в памяти. 

Каждый каталог страниц имеет до 1024 элементов, 
допуская столько же таблиц страниц. Каждая таблица 
может адресовать до 1024 страниц по 4 Кбайта. Следо¬ 
вательно, один каталог может адресовать 1024x1024x4096 
байт или 4 Гбайта (все физическое адресное пространст¬ 
во 80386). 

Элементы каталога страниц (PDE) и элементы таб¬ 
лицы страниц (РТЕ) почти идентичны. Таблицу страниц 
можно считать «таблицей дескрипторов страниц», а эле¬ 
мент таблицы страниц — «дескриптором страницы». 
Формат элемента приведен на рис. 5.3. Вот описание 
его полей. 

1. СТРАНИЧНЫЙ АДРЕС (биты 31-12). Для PDE 

этот адрес показывает таблицу страниц, а 
для РТЕ — страницу. Младшие 12 бит ад¬ 
реса всегда равны нулю, так как таблицы 
страниц и страницы выравнены по грани¬ 
цам 4 Кбайт. 

2. ЗАРЕЗЕРВИРОВАНЫ OS (биты 11-9). Эти би¬ 

ты доступны для использования OS. Обычно 
они применяются для сбора статистики о вир¬ 
туальной памяти и свопинге страниц (напри¬ 
мер, число обращений к странице за данный 
интервал). 
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3. D (бит 6). Этот бит «грязный» (Dirty bit) для 

РТЕ, который автоматически устанавливается 
при записи в страницу. 

4. А (бит 5). Это бит обращения для PDE и РТЕ; 

он устанавливается автоматически при считыва¬ 
нии или записи в страницу. 

5. U/S (бит 2). Это бит индикации пользова¬ 

тель/супервизор. Если он установлен, то разре¬ 
шен доступ программам с уровнем защиты 3 
(нижний уровень). 

6. R/W (бит 1). Если U/S=l (разрешен доступ 

пользователю), то R/W=0 означает возможность 
считывания, a R/W-1 — еще и записи. Эти 
биты имеют смысл для PDE и РТЕ. Отдельная 
страница защищена в соответствии с наиболее 
ограничивающей парой бит в ее PDE или РТЕ. 
Если U/S=0, запрещены считывание и запись в 
страницу. Если U/S-1 и R/W=0, из страницы 
можно только считывать; когда оба бита содер¬ 
жат 1 (в обоих элементах), разрешены считы¬ 
вание и запись в страницу. 

7. Р (бит 0). Это бит присутствия, который пока¬ 

зывает адресует ли PDE или РТЕ страницу, 
находящуюся в памяти. Если Р-1, то действия 
полей такие, как определено выше. Если же 
Р=0, то нужная страница на диске и остальные 
31 бит могут задавать местоположение страни¬ 
цы на диске. 

Хотя РТЕ содержит много информации о странице, 
ее непросто получить; два обращения к памяти требуют¬ 
ся только для получения адреса каждой страницы. Бу¬ 
фер преобразования TLB в страничном устройстве содер¬ 
жит 32 последних использованных РТЕ. Буфер TLB час¬ 
то содержит нужный РТЕ, сокращая на 95% необходи¬ 
мость фактического обращения к таблицам в памяти 
(подробнее см. гл. 7). 


5.4. ВИРТУАЛЬНАЯ ПАМЯТЬ 

Виртуальная организация памяти позволяет програм¬ 
мисту работать не заботясь о емкости реальной памяти. 
В системах виртуальной памяти диск эффективно пре- 
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вращается в основную память, a RAM («реальная па¬ 
мять») содержит код и данные, используемые процес¬ 
сором. 

Взаимосвязь этих элементов показана на рис. 5.4. 

Число бит в наибольшем адресе, который может 
сформировать процессор, определяет размер его вирту¬ 
ального адресного пространства. В новых процессорах 
типа 80386 есть два вида размера адреса: большой адрес 
определяет виртуальное адресное пространство или ем¬ 
кость памяти, которую может использовать программист; 
малый адрес определяет реальное адресное пространст¬ 
во — емкость оперативной памяти, которую может под¬ 
держивать процессор. В 80386 адресная информация в 
таблицах страниц допускает использование виртуального 
адресного пространства до 64 Тбайт, что эквивалентно 
64000 запоминающих устройств на оптических дисках по 
1 Гбайту. 
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Рис. 5.4 Связь виртуальной памяти с дисковой 
памятью и реальной памятью 
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К реальному адресному пространству можно обра¬ 
щаться по 32-битному адресу с использованием или без 
использования страниц, что обеспечивает размер памяти 
до 4 Гбайт. Однако аппаратная реализация такой памя¬ 
ти пока невозможна. На практике реальные адреса при¬ 
меняются для доступа к RAM, а виртуальные адре¬ 
са — для обращения к виртуальному пространству жест¬ 
кого _ диска. Виртуальные адреса не используют даже 
всего пространства 4 Гбайт, обеспечиваемого 32-битным 
адресом. Большие виртуальные адресные пространства, 
по-видимому, будут применяться сначала для сетей и 
систем связи. 

Простая форма виртуальной памяти уже использует¬ 
ся большими программами. Здесь ядро программы нахо¬ 
дится в памяти все время. Остальная часть программы 
разделяется на блоки примерно по 64 Кбайт. Когда 
пользователь обращается к разным блокам программы, 
они передаются с диска. Каждый такой блок называется 
«оверлеем». Однако разделение программы на оверлеи и 
управление ими представляют для программиста особую 
задачу. 

В виртуальной памяти каждая программа, файл 
данных и т. д. считается набором «страниц» по 4 Кбай¬ 
та. Реальное адресное пространство разделяется на 
«страничные кадры» по 4 Кбайта, а виртуальное адрес¬ 
ное пространство (жесткий диск) — на «страничные сло¬ 
ты» по 4 Кбайта. Когда пользователь обращается к раз¬ 
ным частям программы, страницы передаются из их 
страничных слотов в страничные кадры реальной памя¬ 
ти, где к ним и обращается процессор. Когда память 
заполнена и требуется другая страница, имеющийся 
страничный кадр перезаписывается (если он не изменял¬ 
ся после передачи в память) или копируется в свой 
слот на диске до перезаписи (если он изменялся). Все 
это скрыто от программиста; он просто обращается к 
коду и данным по различным виртуальным адресам, а 
процессор и OS при необходимости передают нужную 
страницу в память. 


5.4.1. Поддержка виртуальной памяти 

Для поддержки виртуальной памяти важную роль 
играют следующие возможности: 
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1. Возможность доступа к большим адресным про¬ 

странствам. 

2. Возможность преобразования виртуальных адресов 

в реальные адреса для обращения к реальной 
или физической памяти (RAM). 

3. Возможность генерировать особые случаи преры¬ 

вания (а не останавливаться), если нужной ча¬ 
сти кода или данных нет в памяти («странич¬ 
ное нарушение»). 

4. Перезапуск команд, если страничное нарушение 

препятствует завершению команды. 

Когда возникает страничное нарушение, OS должна 
передать нужную страницу с диска в память. Если па¬ 
мять заполнена, OS должна записать одну из страниц 
на диск и использовать освобожденное место. 

Несколько важных аспектов виртуальной памяти 
прямо касаются прикладных программистов. Например, 
как быть, если система с памятью 1 Мбайт выполняет 
одновременно три программы, каждая из которых ис¬ 
пользует 640 Кбайт RAM. Много исследований по таким 
вопросам выполнено на больших компьютерах, но их 
результаты не применимы прямо к системам с микро¬ 
компьютерами. 

Предварительные оценки показывают, что компью¬ 
тер может безопасно работать с виртуальной памятью, 
емкость которой вдвое больше реальной памяти. Поэто¬ 
му три программы по 640 Кбайт могут хорошо выпол¬ 
няться в системе с памятью 1 Мбайт. Важным моментом 
является размер «рабочего множества» каждой програм¬ 
мы. Если каждая программа обращается к большому 
числу страниц повторно (имеет большой рабочий набор), 
то каждая может заставить OS часто обращаться к дис¬ 
ку, вызывая «пробуксовку». Такая ситуация может воз¬ 
никнуть при повторяющихся расчетах с одновременным 
компилированием большой программы или сортировкой 
большого объема данных. 



Глава 6 


РЕЖИМ 

ВИРТУАЛЬНОГО 8086 


В предыдущих главах рассмотрены реальный и за¬ 
щищенный режимы работы процессора 80386. В этой 
главе обсуждается режим виртуального 8086 (Ѵ8086), 
который позволяет выполнять задачу (например, при¬ 
кладную программу) как будто в реальном режиме, но 
OS имеет доступ ко всем возможностям защищенного 
режима. Дается сравнение всех режимов 80386 с 8086, 
различия между процессорами и их влияние. Наконец, 
мы обсудим, как эти факторы соотносятся с возможно¬ 
стями OS. Это поможет читателю сделать обоснованный 
выбор OS и «выжать» из нее максимум возможного. 

Поясняется также, как 80386 может одновременно 
выполнять программы для PC и 32-битные задачи; поче¬ 
му 80286 не может выполнять многие прежние програм¬ 
мы даже в реальном режиме и почему первые (и самые 
дешевые) OS могут использовать только часть возможно¬ 
стей процессора. По существу, эта глава объединяет 
прошлое и будущее. 


6.1. ОПРЕДЕЛЕНИЕ РЕЖИМА 
ВИРТУАЛЬНОГО 8086 

Для компьютеров на базе процессоров 8086/88 и 
80286 стоимость имеющегося программного обеспечения 
составляет более 5 млрд, долларов. Его (программы и 
OS) можно реализовывать без изменений в реальном ре¬ 
жиме 80386. В этом режиме одновременно выполняются 
только OS и одна программа, обеспечивая совместимость 
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с программами для PC и АТ, но не используя всех воз¬ 
можностей 80386. Для OS и программиста процессор 
80386 выглядит, как более быстрый 8086 с дополнитель¬ 
ными регистрами и командами и с тем же ограничением 
памяти 1 Мбайт. 

Альтернативой реальному режиму является защи¬ 
щенный режим, в котором обеспечивается доступ ко 
всем ресурсам 80386: мультизадачность, организация 
страниц, виртуальная память и др. Компьютер в целом 
может работать только в реальном или защищенном ре¬ 
жиме. Однако, хотя компьютер работает в защищенном 
режиме, отдельная задача (ей может быть одна програм¬ 
ма или OS) может выполняться в режиме виртуального 
8086, что обеспечивает задаче среду 8086 (такую же, 
как среда реального режима 80386). Тем временем OS 
80386 и другие программы имеют доступ ко всем ресур¬ 
сам компьютера, работающего в защищенном режиме. 

Для разговора о режиме V8086 нам придется уточ¬ 
нить и расширить словарь. Задача — это любая незави¬ 
симо выполняющаяся программа; точнее, задача — это 
программа, которая имеет в 80386 сегмент состояния за¬ 
дачи TSS или его эквивалент. TSS хранит содержимое 
регистров и другую информацию, позволяя OS остано¬ 
вить и запустить задачу в любой момент времени. 

OS 8086 типа DOS 2.x или другой версии может 
выполняться как задача. Когда пользователь выполняет 
эту задачу, он может запустить, выполнить и осущест¬ 
вить выход почти из любой программы, которая работа¬ 
ет на 8086 или 80286. Следовательно, мы имеем OS ти¬ 
па DOS 2.x, выполняющуюся под собственной OS 80386, 
которая управляет организацией страниц, виртуальной 
памятью и приоритетами среди выполняющихся одновре¬ 
менно других задач. Чтобы избежать путаницы, мы бу¬ 
дем иногда называть собственную OS 80386 гипервизо¬ 
ром (чтобы отличить ее от другой OS, выполняющейся 
как задача). Гипервизор дает пользователю возможность 
задавать приоритеты и переключать несколько задач. 


6.2. ВИРТУАЛЬНЫЕ МАШИНЫ 


В виртуальной памяти очень большие программы и 
огромные структуры данных ведут себя так, как будто 
одновременно находятся в памяти. OS отвечает за рас- 
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пределение, пространства памяти и при необходимости 
перераспределяет код и данные в тех ситуациях, когда 
все сразу поместиться в память не может. 

«Виртуальная машина» расширяет понятие виртуаль¬ 
ной памяти на весь компьютер с устройствами вво¬ 
да/вывода (например, клавиатура и дисплей), набором 
регистров и т. д. Программа выполняется так, как будто 
она имеет в своем распоряжении целую машину (в дан¬ 
ном случае, компьютер на базе 8086); отсюда возникло 
название «режим виртуального 8086». Когда программа 
осуществляет вызовы системных ресурсов (например, за¬ 
пись в дисплей), гипервизор 80386 позволяет произвести 
это действие или перехватывает вызов и выполняет за¬ 
пись сам. 

Предположим, что ассемблерная программа 8086 хо¬ 
чет записать текст «Hello» на экран. Программа вызыва¬ 
ет DOS 3.1 командой INT, и DOS производит запись на 
экран. Однако DOS 3.1 работает как задача V8086, ко¬ 
торая имеет уровень привилегий 3. Гипервизор назнача¬ 
ет области ввода/вывода уровень привилегий 0, поэтому 
запись DOS вызывает особый случай защиты. Вектор 
прерывания вызывает переключение на гипервизор, кото¬ 
рый должен решить, что пытается сделать задача V8086, 
эмулировать это действие (производя запись на экран 
или игнорируя попытку), а затем возвратить управление 
задаче DOS V8086. Чем больше таких перехватов, тем 
больше замедляется ассемблерная программа 8086, когда 
она или DOS пытается производить операции ввода/вы¬ 
вода или пользоваться другими системными, ресурсами. 
Такой же подход применим к режиму V8086 для OS 
СР/М-86 или UNIX. 

Выше сказано, что область ввода/вывода имеет уро¬ 
вень привилегий 0, но адреса формируются, как в 8086 
(предел 1 Мбайт), поэтому сегментная защита (рассчи¬ 
танная на полные адреса 80386) не работает. Адрес 
8086 передается в страничное устройство, где его можно 
отобразить на любую страницу, находящуюся в опера¬ 
тивной памяти или на диске (виртуальная память). Сле¬ 
довательно, OS может реализовать защиту страниц при 
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выполнении задачи V8086 и может поддерживать вирту¬ 
альную память для нескольких задач V8086, используя 
страничную организацию и таблицы страниц. 

Как же режим V8086 «обманывает» программу, ко¬ 
торая полагает, что она выполняется на 16-битном 8086, 
а не на 32-битном 80386? 

Бит 17 в регистре EFlags называется ѴМ (виртуаль¬ 
ный режим). Когда начинает выполняться задача Ѵ8086, 
бит ѴМ устанавливается в 1. Этот бит сообщает о том, 
что надо формировать адреса и управлять сегментами 
как в реальном режиме, поэтому адреса получаются пу¬ 
тем сдвига нужного сегмента регистра влево на 4 бита, 
прибавления 16-битного смещения и использования ре¬ 
зультата как адреса памяти. Полученный 20-битный ад¬ 
рес позволяет адресовать память 1 Мбайт. Бит ѴМ так¬ 
же делает доступной текущей задаче только 16-битную 
часть 32-битного регистра, например, EFlags. Отметим, 
что бит ѴМ при этом недоступен задаче. 

Когда бит ѴМ установлен, некоторые привилегиро¬ 
ванные коды операций вызывают особые случаи преры¬ 
вания. Разрешено выполнять только команды и исполь¬ 
зовать режимы адресации 8086. 

Теперь можно пояснить, как работает реальный ре¬ 
жим 80386. Когда бит разрешения защиты в слове со¬ 
стояния машины сброшен, действуют такие же ограниче¬ 
ния 16-битной адресации и кодов операций, как и в ре¬ 
жиме виртуального 8086. В обоих случаях текущая за¬ 
дача выполняется, как в 8086. Различие в том, что сло¬ 
во состояния машины управляет всей машиной, переводя 
ее в реальный режим, а регистр EFlags управляет толь¬ 
ко текущей задачей; текущая задача выполняется, как в 
реальном режиме, но переключение задачи на гиперви¬ 
зор выключает флажок ѴМ, вновь разрешая использо¬ 
вать привилегированные коды операций и режимы адре¬ 
сации. 


6.3. ЕЩЕ О ВИРТУАЛЬНЫХ РЕЖИМАХ 

Ниже несколько подробнее рассматривается текущее 
состояние виртуальных режимов. Материал непосредст¬ 
венно к. режиму Ѵ8086 не относится и его можно про¬ 
пустить. 
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Идея виртуальных машин впервые реализована в 
ІВМ/370. Операционная система ѴМ для этих машин 
разработана в конце 60-х годов. Она состоит из двух 
частей: СР и CMS. Часть СР (управляющая программа) 
выполняет ту же функцию, что и гипервизор 80386, 
распределяя ресурсы задачи, перехватывая вызовы и 
эмулируя или игнорируя их. Отдельные программы вы¬ 
полняются под управлением однопользовательской одно¬ 
задачной OS, называемой CMS (диалоговая мониторная 
система). CMS похожа на копии DOS, о которых мы го¬ 
ворили; она как бы управляет компьютером, но факти¬ 
чески она вызывает СР, когда пытается обратиться к 
устройствам компьютера. 

СР может выполнять другую копию СР, как задачу 
под собой. Ни одна копия не «знает», управляет ли она 
компьютером; она просто действует обычным образом, 
используя все ресурсы системы, а «верхняя» СР пере¬ 
хватывает вызовы «нижней». 

В процессоре 80386 ситуация другая. Он может вы¬ 
полнять задачи V8086, в которых дублируется среда 
8086, и под ней выполняются все программы и OS 
8086. Программа реального режима 80286 (типа 8086) 
будет также выполняться под ней, но OS 80286 и 80386 
не могут выполняться как задачи под гипервизором 
80386. Говорится, что 80386 может «виртуализировать» 
8086, но не 80286 или себя. Объясняется это некоторы¬ 
ми проблемами .с такими командами как PUSH и POPF. 

Это означает, что 80386 может выполнять OS типа 
8086, но не может выполнять версии DOS или UNIX 
для 80286, как «приглашенные» задачи. Эти программы 
могут выполняться как OS для 80386 при правильной 
подготовке, но процессор при этом будет полностью 
эмулировать 80286 и машина не будет обладать возмож¬ 
ностями 80386 (страничная организация, мультизадач¬ 
номъ и др.). 

Когда 80386 работает в реальном режиме, он дейст¬ 
вует как быстрый 8086. При выполнении OS 80286 он 
действует как быстрый 80286. Но когда он выполняет 
задачу Ѵ8086, OS и задачи, выполняющиеся параллель¬ 
но с задачей Ѵ8086, имеют доступ ко всем ресурсам 
80386. Задаче Ѵ8086 не нужны все эти возможности, ей 
нужно только полное управление 8086. Однако задача 
Ѵ8086 может выполняться на 80386 медленнее, чем 
раньше. В случае мультизадачное™ задача Ѵ8086 замед¬ 
ляется из-за того, что не работает все время. Даже ес- 
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ли выполняется только одна задача V8086, многие вызо¬ 
вы DOS приводят к переключению задачи на гиперви¬ 
зор, который должен определять, что произошло, эмули¬ 
ровать ли запрос DOS или нет, а затем возвращать уп¬ 
равление DOS. Между исходным вызовом DOS и возвра¬ 
том выполняется множество команд, замедляя програм¬ 
му. Точное поведение зависит от того, какие вызовы 
DOS перехватываются гипервизором (вызывая дополни¬ 
тельную обработку), а какие разрешено выполнять. 

Когда гипервизор поддерживает несколько задач 
V8086, он должен использовать страничную организа¬ 
цию. Это объясняется тем, что каждая задача формиру¬ 
ет адреса в одном и том же диапазоне от 0 до 
1 Мбайта. Страницы могут отобразить большинство этих 
адресов сверх 1 Мбайта. Но их нельзя использовать для 
разделения разными задачами OS и/или кода гипервизо¬ 
ра. Наконец, страничная организация защищает области 
ввода/вывода от прямого доступа со стороны V8086. 


6.4. СРАВНЕНИЕ ПРОЦЕССОРОВ 
И РЕЖИМОВ 

Имеется два основных типа программ, которые ра¬ 
ботают на процессорах семейства 8086. К первому отно¬ 
сятся программы реального режима, включая программы 
и OS 8086/88, программы реального режима 80286, про¬ 
граммы реального режима 80386 и задачи V8086. Ко 
второму относятся программы защищенного режима, 
включающие OS и прикладные программы 80286 и 
80386, которые выполняются в защищенном режиме на 
одном из двух процессоров. Мы не будем рассматривать 
совместимость между OS и программами защищенного 
режима 80286 и возможности 80386 выполнять програм¬ 
мы 80286. 

Мы сделаем акцент на сходствах и различиях про¬ 
грамм реального режима. Эта информация поможет в 
переносе на 80386 программ 8086 и реального режима 
80286 для выполнения их как задач V8086 или задач 
защищенного режима (возможно с прямой зависимостью 
от OS 80386). 


10 Зак. 2046 
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6.4.1. Сравнение программ 8086 
с программами реального 
и защищенного режимов 80386 

Одно из многих достоинств процессора 80386 состо¬ 
ит в том, Что в реальном режиме он может выполнять 
программы и OS 8086 почти неизменными. Он может 
также выполнять их как задачи V8086, поэтому они мо¬ 
гут выполняться без изменений, в то время как гипер¬ 
визор разрешает использовать страничную организацию, 
мультизадачность и другие возможности. 

Есть два вида различий между программами 8086 и 
программами V8086/80386 реального режима. Первые 
связаны с модернизацией, например, новыми командами 
и регистрами. Вторые же являются сюрпризами — это 
те различия, которые заставляют программу 8086 вести 
себя по-другому при выполнении на 80386. Некоторые 
улучшения также могут превратиться в сюрпризы, на¬ 
пример, повышенное быстродействие может вызвать от¬ 
клонения в поведении некоторых программ. Будучи оп¬ 
тимистами, мы вначале остановимся на улучшениях. 

Первое улучшение —• скорость. Программа в реаль¬ 
ном режиме 80386 выполняется в 6—10 раз быстрее, 
чем на 8086. Почти половина ускорения приходится на 
повышение частоты синхронизации с 5 МГц до 16 МГц 
и более. В программах с большим числом таких команд, 
как IMUL, скорость возрастает еще больше. Для пользо¬ 
вателей большинства программ будет заметно одно раз¬ 
личие. Если 80386 обращается к достаточно быстрому 
жесткому диску, быстродействие возрастает. Увеличение 
скорости не зависит от программиста; в программе ника¬ 
ких изменений не нужно. Кроме того, в любой момент 
программу можно выполнить на компьютере с 8086. 
Программа 8086 может также выполняться в режиме 
мультизадачное™ с другими программами 80386. 

Дальнейшее повышение производительности в реаль¬ 
ном режиме требует изменений в самой программе. Они 
делают программу меньше, быстрее и от этого более 
гибкой; однако программа становится несовместимой с 
8086. При внесении изменений (которые не потребуют 
полного переписывания программы) нужно учитывать, 
что она не будет выполняться на компьютерах с 8086, 
если в ней использованы новые возможности реального 
режима 80386. Целесообразно указать в комментариях 
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новый код для 80386 и сохранить любой удаляемый код 
(в виде комментариев или в виде библиотечной про¬ 
граммы). Рассмотрим эти новые возможности. 


6.4.2. Новая архитектура 

Процессор 80386 имеет два новых регистра FS и 
GS. Они выполняют такую же функцию как регистр 
ES, адресуя базу дополнительных сегментов данных. Од¬ 
нако ES используется как неявный получатель в некото¬ 
рых циклических операциях. Регистры FS и GS не свя¬ 
заны ни с какой командой и находятся в полном распо¬ 
ряжении программиста. Программы 8086 можно оптими¬ 
зировать, храня часто используемые переменные в сег¬ 
ментах, адресуемых FS и GS. Префиксы замены сегмен¬ 
та позволяют использовать эти регистры как базовые 
для адресации новых сегментов данных. 

Программы реального режима могут работать также 
с 32-битными регистрами, например MOV ЕАХ, ЕВХ. 
Ассемблер образует префикс размера операнда для обра¬ 
щения к 32-битному регистру (длина регистров по умол¬ 
чанию в реальном режиме 16 бит). Старшие 16 бит ре¬ 
гистров нельзя считать нулевыми без предварительной 
инициализации. Сложение 32-битных операндов увеличи¬ 
вает быстродействие многих программ. 

Отладочные регистры можно использовать непосред¬ 
ственно из программы или из внешнего отладчика, что 
ускоряет отладку программы. Управляющие регистры не¬ 
доступны прикладным программам (за исключением до¬ 
ступа через шлюзы и вызовы, обеспечиваемые OS), а 
регистры отладки обычно не используются. Так как ре¬ 
гистры отладки не входят в стандартную архитектуру 
80386, в новых моделях процессора их может и не 
быть. 


6.4.3. Новые и измененные команды 

В процессорах 80186/188 и 80286 введено несколько 
новых команд. Скорость выполнения команд типа MUL 
значительно повышена. Процессор 80286 является базо¬ 
вым для персональных компьютеров IBM PC/AT. В ре¬ 
альном режиме он имеет тот же набор команд, что и 
ю* 
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80186/188, а в защищенном режиме — все средства 
80386, но для 16-битной архитектуры. 

Реальный режим 80386 имеет все команды предше¬ 
ственников. Ниже рассмотрены новые команды. 

PUSHA и РОРА 

Эти команды обеспечивают включение в стек и из¬ 
влечение из стека всех 8 регистров общего назначения. 
Команды PUSHAD и POPAD работают в 80386 с 32- 
битными регистрами, a PUSHA и РОРА только с млад¬ 
шими 16 битами. В 80386 эти команды выполняются 
почти столько же времени, что и 8 отдельных команд 
PUSH и POP. 

INS и OUTS 

Это команды блоковой пересылки -байт, слов и 
двойных слов с автоматическим инкрементом или декре¬ 
ментом SI, который адресует участвующий в операции 
блок памяти. 

ENTER и LEAVE 

Эти команды включают в стек и извлекают из сте¬ 
ка «стековый кадр». Стековый кадр содержит счетчик 
уровня вложения текущей процедуры, счетчик размера 
памяти для передачи параметров и байты самих пара¬ 
метров. Эти команды предназначены для разработчиков 
компиляторов. 

BOUND 

Команда BOUND сравнивает знаковый индекс мас¬ 
сива из регистра с двумя ячейками памяти, содержащи¬ 
ми нижнюю и верхнюю границы индекса. Длина чисел 
в 80386 составляет 16 или 32 бита. 

НЕПОСРЕДСТВЕННЫЕ ОПЕРАНДЫ ДЛЯ КОМАНД 

Непосредственное значение можно включить в стек, 
использовать в умножении и в качестве счетчика для 
циклических сдвигов. Это сокращает общее число ко¬ 
манд. 
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6 . 4 . 4 . Новые команды 
для реального режима 80386 


Для реального (и защищенного) режима 80386 вве¬ 
дено много новых команд. Кроме того, некоторые ко¬ 
манды модифицированы из-за наличия 32-битных опе¬ 
рандов. Некоторые новые команды связаны с изменения¬ 
ми архитектуры. 

LSS, LFS, LGS 

Новые команды загрузки указателя предназначены 
для новых регистров SS, FS и GS. Как и в других ко¬ 
мандах загрузки из указанной ячейки памяти произво¬ 
дится загрузка сегментного регистра или другого указан¬ 
ного регистра. Команды LFS и LGS предназначены для 
новых регистров, а команда LSS упрощает создание не¬ 
скольких сегментов стека. 

MOV 

Команду MOV можно использовать для пересылки 
данных в/из регистров отладки, управления и проверки. 
Она предназначена для новых регистров. 

MOVSX, MOVZX 

При наличии регистров длиной в два слова возни¬ 
кает проблема, как заполнять дополнительные разряды 
при пересылке байта или слова в двойное слово. Коман¬ 
да MOVZX заполняет их нулями, а команда 
MOVSX — знаковыми (старшими) битами источника. 
Команда MOVZX сохраняет значение беззнакового числа, 
а команда MOVSX — знакового. Эти операции работают 
и при пересылке байта в слово. 

ДРУГИЕ КОМАНДЫ 

Некоторые новые команды отсутствовали в прежних 
процессорах семейства 8086. Программа с этими коман¬ 
дами становится более гибкой, но не совместима с 
прежними процессорами. 
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1. Условные переходы с большим диапазоном. 

Команды вида JS имели раньше диапазон от 
-128 до +127 байт. В 80386 сохранены эти ко¬ 
манды и добавлены условные «близкие перехо¬ 
ды» (переходы в пределах текущего сегмента). 

2. Команды манипуляций битами. 

Новыми командами являются ВТ, BTC, BTR и 
BTS. Они проверяют бит, передавая его во 
флажок переноса. Команды различаются тем, 
что делается с проверяемым битом: он не из¬ 
меняется, инвертируется, сбрасывается в 0 или 
устанавливается в 1. 

3. Команды сканирования бита. 

Новые команды BSF и BSR находят младший 
(BSF) или старший (BSR) единичный бит в 
слове или двойном слове из регистра. 

4. Двойные сдвиги. 

Команды SHLD и SHRD реализуют сдвиги 
двойной точности. Они позволяют сдвинуть 16- 
или 32-битный операнд в любую сторону до 31 
бита, как в обычном сдвиге; освобождающиеся 
биты заполняются битами из операнда-регистра. 
Однако второй операнд не изменяется. 

5. Установка байта по условию. 

Эти команды похожи на команды условного пе¬ 
рехода; большинство условий, вызывающих пе¬ 
реход, могут установить в 1 байт (если условие 
удовлетворяется) или сбросить в 0 байт (если 
условие не удовлетворяется). Такая возмож¬ 
ность удобна для определения нескольких усло¬ 
вий перехода. 


6.4.5. Другие различия между программами 
8086 и защищенного режима 80386 

Рассматриваемые далее различия касаются совмести¬ 
мости программ 8086 и реального режима 80386. Они 
относятся к программам 8086 и тем же программам, вы- 
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полняющимся как задачи V8086. Различия объединены в 
несколько групп. 

ГРУППА 1: УСКОРЕНИЕ КОМАНД 

Повышение производительности процессора 80386 
объясняется увеличением частоты синхронизации более 
чем в три раза и уменьшением числа тактов. Более вы¬ 
сокая частота синхронизации может вызвать проблемы 
для всех программ, полагающих, что команды выполня¬ 
ются конкретное время. Меньшее число тактов означает, 
что задержки для некоторых устройств ввода/вывода 
становятся меньше. 

ГРУППА 2: ЗАВОРАЧИВАНИЕ 

Если программа для 8086 определяет адрес больше 
1 Мбайта, адрес усекается, т. е. он относится к первым 
64 Кбайтам адресного пространства. В процессоре 80386 
используется полученное значение, как есть. 

Процессор 8086 позволяет обращаться к байтам со 
смещением больше 65535 (код или данные) с заворачи¬ 
ванием к байту 0 того же сегмента. Обращения со сме¬ 
щениями ниже 0 (только данные) вызывают завора¬ 
чивание к байту 65535 того же сегмента. Процессор 
80386 в обоих ситуациях генерирует особый случай 
прерывания (12 для стековых данных и 13 для осталь¬ 
ных). 

Сдвигами и циклическими сдвигами управляют 
только 5 младших бит счетчика сдвигов. Максимальное 
значение сдвига равно 31; значения больше 31 вызыва¬ 
ют сдвиг на число разрядов равное остатку от деления 
счетчика на 32. 

ГРУППА 3: ПРЕФИКСЫ 

В процессоре 8086 можно использовать избыточные 
префиксы, префикс LOCK по желанию, а префиксы пе¬ 
ред командой ESC игнорируются, когда выполнение воз¬ 
обновляется после обработки прерывания. В 80386 длина 
команд не может быть больше 15 байт, что вызывает 
проблемы только при использовании избыточных пре¬ 
фиксов. Префикс LOCK допускается только перед неко¬ 
торыми командами, когда они модифицируют память: 
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проверки бит, сложения и вычитания, инкременты и де¬ 
кременты, команда XCHG с одним операндом в памяти. 
Наконец, префиксы перед командой ESC выполняются, а 
не игнорируются. 

ГРУППА 4: ОСОБЫЕ СЛУЧАИ ПРЕРЫВАНИЯ 

В процессоре 8086 особый случай, возникающий 
при делении, возвращает значение регистров, адресую¬ 
щих команду, следующую после DIV, а в 80386 они ад¬ 
ресуют саму команду DIV. В 8086 команда IDIV вызы¬ 
вает особый случай прерывания, если частное равно 80Н 
(байты) или 8000Н (слова); процессор 80386 возвращает 
правильное частное. 

Особый случай прерывания в пошаговом режиме 
80386 имеет более высокий приоритет, чем внешнее 
прерывание, поэтому выполнение программы в пошаго¬ 
вом режиме предотвращает пошаговое выполнение внеш¬ 
него прерывания. Когда воспринимается немаскируемое 
прерывание NMI, дальнейшие NMI маскируются до вы¬ 
полнения команды IRET в процедуре обработки первого 
NMI. 

Неопределенный код операции для 80386 вызывает 
прерывание 6. 

ГРУППА 5: ЧИСЛЕННЫЕ СОПРОЦЕССОРЫ 

Повышенная скорость 80386 может вызвать пробле¬ 
мы при работе с сопроцессором. Когда несколько испол¬ 
няемых 8086 команд дают время, достаточное для опе¬ 
рации сопроцессора, в 80386 они выполняются быстрее и 
сопроцессору может не хватить времени. 

В 80386 все ошибки сопроцессора направляются на 
прерывание 16. Для прерываний сопроцессора контроллер 
прерываний больше не применяется. 

ГРУППА 6: ВКЛЮЧАЕМЫЕ В СТЕК ЗНАЧЕНИЯ 

При включении в стек SP теперь включается его 
значение до декремента самой командой PUSH; ранее в 
стек включалось значение SP после текущей команды 
PUSH. Кроме того, команда PUSHF для 8086 всегда 
имела Г в разрядах 12—15. В 80386 бит 15 всегда 0, а 
биты 12, 13 и 14 содержат последние загруженные в 
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них значения; биты 12 и 13 — это поле IOPL, а бит 
14 — флажок вложенной задачи. 


6.5. ОСОБЕННОСТИ ОПЕРАЦИОННОЙ 
СИСТЕМЫ 

Существует много типов OS. Процессор 80386 с 
поддержкой модели плоской памяти и другими возмож¬ 
ностями повлечет использование многих OS миникомпь¬ 
ютеров. С нашей точки зрения важнейшее различие 
между OS касается степени использования потенциаль¬ 
ных возможностей 80386. Здесь возможно несколько под¬ 
ходов. 

Простейший гипервизор просто запускает одну зада¬ 
чу V8086, разрешая одному пользователю реализовать 
одну копию OS 8086. При этом поддерживается одна 
программа. Расширяя эту первую модель, можно исполь¬ 
зовать страничную организацию для эмуляции таких 
возможностей, как память более 640 Кбайт. Допускается 
использовать виртуальную память, поэтому программа 
может работать с памятью больше физической путем 
свопинга страниц с жесткого диска. 

Следующий шаг — разрешить выполнять несколько 
задач V8086 одновременно. Как только вводится мульти- 
задачность, гипервизор должен перехватить все команды, 
которые изменяют флажок IF; в противном случае про¬ 
граммы могут «зависнуть». В этом случае увеличивается 
обьем служебных операций. OS может быть однопользо¬ 
вательской мультизадачной системой, многопользова¬ 
тельской системой с одной задачей у каждого пользова¬ 
теля и даже многопользовательской мультизадачной сис¬ 
темой. Такая система либо потребует, чтобы компьютер 
имел достаточную физическую память для каждого 
пользователя, либо организует виртуальную память с 
привлечением жесткого диска. Однако отдельные задачи 
остаются задачами V8086 и не используют всех возмож¬ 
ностей 80386. 

Наконец, последний гипервизор (многопользователь¬ 
ская мультизадачная система с виртуальной памятью) 
можно расширить, допустив одновременное выполнение с 
задачами V8086 программ защищенного режима 80386. 
Такой гипервизор должен включать полную OS для об¬ 
работки системных вызовов программ защищенного ре- 
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жима. Он должен обеспечить совместимость с DOS, что¬ 
бы все задачи V8086 обращались к одному коду OS в 
гипервизоре, не требуя иметь отдельную копию OS в 
каждой задаче V8086. 

Такое вводное обсуждение касается основных мо¬ 
ментов с точки зрения максимального использования 
80386. Балансирование между увеличенными возможно¬ 
стями и необходимостью использовать существующие 
программы характерно для каждого владельца системы 
на базе 80386 и помогает выбрать нужную OS. 


6.5.1. Примеры гипервизоров 

Первый гипервизор фирмы Microsoft для Compaq 
80386 делает очень немного. Он запускает одну задачу 
V8086, а затем передает управление ближайшей копии 
DOS 2.x или другой версии. Пользователь запускает ко¬ 
пию DOS, а затем выполняет программу как на IBM 
PC. Страницами защищаются только адреса расширенной 
памяти сверх 640 Кбайт. При обращении по одному из 
этих адресов возникает нарушение защиты и переключе¬ 
ние задачи на гипервизор. Он осуществляет обращение 
к памяти, а затем возвращает управление программе. В 
общем задача V8086 должна выполняться быстрее, так 
как используется полное быстродействие 80386 с замед¬ 
ленным обращением к расширенной памяти. 

Более мощная OS должна допускать одновременное 
выполнение нескольких задач V8086. Пользователь рабо¬ 
тает с Lotus 1-2-3 в интерактивном режиме, а Турбо 
Паскаль компилирует программу в фоновом режиме. 
Пользователь задает двум программам процент использу¬ 
емого времени процессора. Процессор выполняет одну 
программу несколько миллисекунд, а затем переключает¬ 
ся на другую. Если для обоих программ недостаточно 
RAM, то 80386 и OS будут применять виртуальную па¬ 
мять. В любой момент времени содержимое памя¬ 
ти — это страницы кода и данных, которые использова¬ 
лись последними. 

Существуют хитроумные программы, вызывающие 
некоторые проблемы. Например, игра может работать 
только с конкретной версией DOS. Пользователь может 
запустить эту версию DOS и игру как новую задачу от¬ 
дельно от других программ и переключаться между ни- 
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ми по желанию. В памяти находятся только последние 
части старой версии DOS и игры, а остальные хранятся 
на диске. 

Операционные системы такого типа очень трудно 
написать. Сложно реализуются «стратегии замены стра¬ 
ниц» и затруднена отладка OS. Однако созданная и ис¬ 
пытанная 0S многократно увеличивает возможности ком¬ 
пьютера. 



Глава 7 


ВНУТРЕННЯЯ 
ОРГАНИЗАЦИЯ 
ПРОЦЕССОРА 80386 


Процессор 80386 намного сложнее и мощнее своих 
предшественников. Программист, знающий его работу на 
аппаратном уровне, будет работать с большим удовольст¬ 
вием. Данная глава начинается с того, как процессор 
взаимодействует с памятью и сопроцессорами. Затем 
рассматриваются его функциональные блоки. Наконец, 
поясняется вся последовательность выполнения команд. 

Материал данной главы не обязателен для работы с 
80386, но очень полезен. Когда вы познакомитесь с про¬ 
цессором и захотите «выжать» из него максимум воз¬ 
можностей, знание его организации поможет в этом. С 
компьютером приятнее работать, понимая, как он себя 
ведет. 


7.1. ПРОИЗВОДИТЕЛЬНОСТЬ 
КОМПЬЮТЕРА 

Содержание следующих разделов поможет в выборе 
конфигурации компьютера на базе 80386. Показаны спо¬ 
собы организации компьютера для достижения оптималь¬ 
ной производительности и некоторые ограничения совре¬ 
менной технологии. 

Компьютер состоит из нескольких частей, каждая 
из которых взаимодействует с другими. Компьютер с 
гибким диском может выполнять миллионы операций 
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в секунду и ожидать 0.5 с при считывании данных 
с диска. 

Такое же взаимодействие происходит между процес¬ 
сором и памятью, когда процессор должен ожидать 
окончания операции записи или считывания. Именно по¬ 
этому вводятся внутренние регистры для сохранения 
промежуточных результатов, чтобы часто не обращаться 
к памяти. Однако в циклических операциях процессор 
должен часто обращаться к памяти. Для такого быстрого 
процессора, как 80386, ускорение взаимодействия с па¬ 
мятью особенно важно; преимущество наличия быстрого 
процессора уменьшается, если каждое обращение к па¬ 
мяти вызывает долгое ожидание. 

При обсуждении быстродействия 80386 очень важ¬ 
ным понятием является такт синхронизации. Генератор 
синхронизации подает периодический сигнал на вход 
CLK2. Процессор 80386 преобразует два такта генерато¬ 
ра в один внутренний такт. При частоте синхронизации 
32 МГц такт длится 62.5 нс. 

Некоторые внутренние функции 80386 реализуются 
за половину такта. Даже самая короткая команда (на¬ 
пример, пересылка из одного регистра в другой) длится 
два такта. 

На рис. 7.1 показаны сигналы CLK2 и такт процес¬ 
сора. 


7.2. ОБРАЩЕНИЕ К ПАМЯТИ 

Большинство программистов говорят об «обращении 
к памяти» и «трехтактном доступе к RAM», не зная об 
аппаратных деталях. Чтобы лучше разобраться в воз¬ 
можностях 80386, нужно глубже понимать то, что про¬ 
исходит в компьютере. 

Когда процессору требуется прочитать байт из па¬ 
мяти, он сначала вычисляет адрес этого байта. После 
этого он выдает адрес на группу контактов, образующих 
шину адреса. Во многих компьютерах одни и те же 
контакты применяются для адреса и для данных с вре¬ 
менным мультиплексированием (в 8086 и 80286), но в 
80386 есть по 32 независимых контакта для адреса и 
данных. Код на шине адреса показывает микросхемам 
памяти, какой байт нужен процессору. Микросхемы 
RAM считывают байт и помещают его на шину данных. 
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1 период синхронизации процессора 


Рис. 7.1 Сигналы синхронизации 


Микросхемы динамических RAM (DRAM), которые при¬ 
меняются в большинстве компьютеров, теряют содержи¬ 
мое после выдачи его на шину данных и должны реге¬ 
нерироваться. Статические RAM (SRAM) быстрее DRAM 
и не требуют регенерации, но они дороже и имеют 
меньшую емкость. Шина данных передает байт через 
мультиплексоры, приемопередатчики и приемники и по¬ 
дает его на входные контакты процессора. Процессор 
вводит байт на свою внутреннюю шину данных. Если 
микросхемы RAM реагируют быстро на запрос данных, 
то весь процесс (выдача адреса, помещение данных на 
шину и возврат данных в процессор) занимает два так¬ 
та. Следовательно, система на базе 80386 с синхрониза¬ 
цией 16 МГц требует для считывания из памяти байта, 
слова или двойного слова 125 нс. 

Отметим условие «если микросхемы RAM реагируют 
быстро». Когда доступ к памяти требует лишний такт, 
так как микросхемы RAM не реагируют достаточно быс¬ 
тро, этот такт называется «состоянием ожидания». Мед¬ 
ленный процессор может использовать медленные микро¬ 
схемы без введения состояний ожидания. При повыше¬ 
нии скорости процессора одна и та же микросхема па- 
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мяти может потребовать введения одного или даже двух 
тактов ожидания. В процессоре 80386 реализовано не¬ 
сколько приемов, позволяющих применять относительно 
медленные микросхемы памяти без введения состояний 
ожидания. 

Один из таких приемов называется конвейеризацией 
адреса. Обычно термин «конвейеризация» означает па¬ 
раллельную работу устройств опережающей выборки, 
преддешифрирования, выполнения и управления па¬ 
мятью. В 80386 конвейер применяется и при обращении 
к памяти. Пусть в системе применяются микросхемы, 
требующие введения одного такта ожидания (62.5 нс 
при 16 МГц). Тогда три последовательные операции 
считывания выглядят так: 


Такт 1: НАЧАЛО. Выдать адрес на шину адреса. 

Такт 2: Ожидать реакции памяти (состояние ожида¬ 
ния). 

Такт 3: Данные возвращаются по шине данных. 

КОНЕЦ. 

Такт 4: НАЧАЛО. Выдать адрес на шину адреса. 

Такт 5: Ожидать реакции памяти (состояние ожида¬ 
ния). 

Такт 6: Данные возвращаются по шине данных. 

КОНЕЦ. 

Такт 7:_ НАЧАЛО. Выдать адрес на шину адреса. 

Такт 8: Ожидать реакции памяти (состояние ожида¬ 
ния). 

Такт 9: Данные возвращаются по шине данных. 

КОНЕЦ. 

Однако 80386 может выдать адрес для одного счи¬ 
тывания при возвращении данных от предыдущего счи¬ 
тывания, поэтому последовательность оказывается коро¬ 
че: 


Такт 1: НАЧАЛО. Выдать адрес на шину адреса. 
Такт 2: Ожидать реакции памяти (состояние ожида¬ 
ния). 

Такт 3: Данные возвращаются. КОНЕЦ и НАЧАЛО. 
Выдать следующий адрес. 

Такт 4: Ожидать реакции памяти (состояние ожида¬ 
ния). 

Такт 5: Данные возвращаются. КОНЕЦ и НАЧАЛО. 
Выдать следующий адрес. 
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Такт 6: Ожидать реакции памяти (состояние ожида¬ 
ния). 

Такт 7: Данные возвращаются. КОНЕЦ и НАЧАЛО. 
Выдать следующий адрес. 

После первого считывания (3 такта) последующие 
операции занимают только 2 такта. Такая же ситуация 
возникает в операции записи: трехтактная запись стано¬ 
вится двухтактной. В обоих случаях первое обращение к 
памяти после холостого цикла шины требует лишний 
такт; аналогично первые несколько команд после JMP 
или CALL (которые нарушают внутренний конвейер 
80386) требуют больше тактов. 

Есть и другие способы избежать состояний ожида¬ 
ния. Например, память, которая вводит состояние ожи¬ 
дания на 16 МГц, может не вводить его на 12.5 МГц, 
но тогда замедляется вся система. Конвейеризация адре¬ 
са необязательна, так как она требует точной синхрони¬ 
зации между процессором и остальной системой. При 
использовании 16-битных, а не 32-битных микросхем па¬ 
мяти, конвейеризация адреса невозможна. 


7.2.1. Расслоение памяти 

Каждый запрос считывания или записи вызывает в 
DRAM определенную последовательность событий: вклю¬ 
чение, ожидание запроса, ответ на запрос и регенера¬ 
ция. Процессор должен ожидать только ответа на запрос 
до перехода к дальнейшим действиям, которые могут 
включать немедленное обращение к другой микросхе¬ 
ме (пока первая регенерируется). При обращении под¬ 
ряд к микросхемам в одном и том же банке происходит 
следующее: получение запроса, ответ на запрос (содер¬ 
жимое пропадает), получение нового запроса, включение 
(процессор ожидает), ответ на запрос и регенерация. 
Дополнительное время на регенерацию банка памяти мо¬ 
жет вызвать введение состояния ожидания при любых 
обращениях к памяти, которые пытаются использовать 
один и тот же банк дважды подряд. 

Простейшая форма организации памяти состоит в 
том, чтобы поместить все микросхемы в один банк (для 
наших целей банк — это любой блок памяти, который 
может регенерироваться при обращении к другому бан- 
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Двойное 

слово 


Четные Нечетные 

двойные слова двойные слова 



Рис. 7.2 RAM с расслоением (2 банка) 


ку). Разделение памяти на несколько банков может со¬ 
кратить время ожидания при последовательных обраще¬ 
ниях к одному банку. 

Процессор обычно обращается к памяти последова¬ 
тельно: сначала данный адрес, затем следующий, вновь 
следующий и т. д. Такие последовательные адреса долж¬ 
ны быть в разных банках памяти. Этот прием реализо¬ 
ван в памяти из двух банков с расслоениями: каждое 
последовательное двойное слово находится в разных бан¬ 
ках. Для этого младший бит адреса служит селектором 
банка. 

Последовательные обращения никогда не вводят до¬ 
полнительных тактов ожидания. Произвольные обраще¬ 
ния имеют 50% шансов введения задержек; организация 
большего числа банков уменьшает задержки при произ¬ 
вольных обращениях, не изменяя ситуацию для более 
частых последовательных обращений. Дополнительные 
расходы на увеличение числа банков компенсируются 
конвейером 80386 и применением кэш-памяти (см. да¬ 
лее), которые допускают введение дополнительных так¬ 
тов ожидания без задержек в обработке. 

RAM с расслоением показана на рис. 7.2. 
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7.2.2. Кэширование памяти 

Кэширование — это применение небольшой быстрой 
памяти для хранения часто используемой или ожидаемой 
информации. При виртуальной организации памяти RAM 
можно использовать как кэш для жесткого диска, а в 
самом процессоре очереди опережающей выборки и де¬ 
шифрирования действуют как кэш информации, которую 
операционное устройство должно обычно запрашивать из 
памяти. Термин «кэширование» часто относится к памя¬ 
ти и подразумевает введение быстрых микросхем памяти 
(обычно SRAM с нулевым временем ожидания) для хра¬ 
нения подмножества информации, находящейся в боль¬ 
шей и медленной основной памяти. Блок-схема кэш-па¬ 
мяти показана на рис. 7.3. 


Кэш (SRAM) 


Контроллер 


Основная 
’ память 
(DRAM) 


Рис. 7.3 Подсистема Кэш-памяти 


Процессор 80386 при 16 МГц может считывать дан¬ 
ные за 125 нс (2 такта), если память реагирует доста¬ 
точно быстро. В конвейерных обращениях время доступа 
может быть увеличено до 187.5 нс (3 такта). В табли¬ 
це 7.1 показаны допустимые времена реакции для раз¬ 
личных микросхем RAM. 

Сейчас большинство SRAM реагируют за 125 нс в 
неконвейерном обращении без состояния ожидания. Быс¬ 
трые, но дорогие DRAM реагируют в окне от 125 до 
187.5 нс с одним тактом ожидания в неконвейерном об¬ 
ращении и без ожидания при конвейеризации. Дешевые 
DRAM реагируют за 187.5—200 нс, вводя 2 такта ожи¬ 
дания без конвейеризации и один с конвейеризацией. 
Системы без кэш-памяти на дорогих DRAM имеют хоро- 
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шую производительность. Однако для огромной памяти 
80386 требуются дешевые микросхемы, поэтому добавле¬ 
ние кэш-памяти на SRAM заметно повышает производи¬ 
тельность системы. 


Таблица 7.1. Время реакции микросхем RAM 


Тип 

обращения 

при 16 МГц 

Тип 

памяти 

ожидания 

Неконвейерное 

125 нс 

SRAM 

0 

считывание 


Быстрая DRAM 

1 



Медлен. DRAM 

2 

Конвейерное : 

187.5 нс 

SRAM 

0 

считывание 


Быстрая DRAM 

0 



Медлен. DRAM 

1 


КЭШПАМЯТЬ 

При использовании кэш-памяти процедура обмена 
данными усложняется. В системе без кэш (и без вирту¬ 
альной памяти) процессор запрашивает информацию, и 
основная память обеспечивает ее. В кэшированной систе¬ 
ме процессор запрашивает информацию и контроллер 
кэш проверяет, нет ли информации в кэш, и если она 
есть, он выдает эту информацию. В противном случае 
запрос передается в основную память. В таблице 7.2 по¬ 
казаны временные соотношения для обоих ситуаций 
(Tw — такт ожидания). 

Из таблицы видно, что 50% попаданий в кэш оз¬ 
начают, что половина обращений не будет вызывать со¬ 
стояние ожидания, но при промахе время обращения 
увеличивается (4 такта ожидания); в результате получа¬ 
ется эквивалент некэшированной памяти с двумя такта¬ 
ми ожидания. К счастью, даже небольшая кэш-память 
объемом 64 Кбайта обеспечивает коэффициент попадания 
90%, что оправдывает расходы на кэш-память. В табли¬ 
це 7.3 показаны проценты попадания для кэш-памяти с 
прямым отображением и строкой в 4 байта; другие спо¬ 
собы отображения и размеры строки улучшают коэффи¬ 
циент попадания на несколько процентов. Имеющиеся 




микросхемы SRAM позволяют реализовать дешевую 
память 64 Кбайта. 


Таблица 7.2. Сравнение обращений 


Действие 

Такты 

Некэшированное считывание: 


выдача адреса в память 

1 

ожидание RAM 

2 

данные возвращаются 

1 

Всего 

4 (два Tw) 

Кэшированное считывание (попадание): 


выдача адреса в кэщ-память 

1 

проверка кэш, возвращение данных 

1 

Всего 

2 (нет Tw) 

Кэшированное считывание (промах): 


выдача адреса в кэш-память 

1 

проверка кэш, нет соответствия 

1 

выдача адреса в память 

1 

ожидание RAM 

2 

данные возвращаются 

1 

Всего 

6 (четыре Tw) 


Таблица 7.3. Размер и эффективность кэш-памяти 


Размер кэш-памяти 

Попадания 

Выигрыи 

Нет кэш, DRAM с двумя Tw 

0% 

0% 

16К 

81% 

35% 

32К 

86% 

38% 

64К 

88% 

39% 

128К 

89% 

39% 

Нет кэш, SRAM без Tw 

100% 

47% 
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Фактический размер RAM мало влияет на произво¬ 
дительность кэш-памяти. Большинство программ повтор¬ 
но обращаются к тем же нескольким килобайтам кода и 
данных. Если, например, вы печатаете письмо в тексто¬ 
вом процессоре, то секции программы управления пе¬ 
чатью и оперативной подсказки (Help) не используются 
несколько минут. Когда вы печатаете, вносите измене¬ 
ния и вновь печатаете, вы вновь и вновь обращаетесь к 
одним и тем же данным. Однако некоторые программы 
с точки зрения кэш-памяти ведут себя плохо. Например, 
при повторных вычислениях больших электронных таб¬ 
лиц кэш действует не эффективно. 

Следующий раздел более подробно освещает работу 
кэш-памяти. Кэш может улучшить производительность 
системы, но производительность компьютера ограничена 
не только памятью, но и параметрами устройств вво¬ 
да/вывода (особенно в части дисков и регенерации дисп¬ 
лея), поэтому при разработке или приобретении компью¬ 
тера нужно учитывать множество факторов, помимо ор¬ 
ганизации кэширования. 

ОБРАЩЕНИЯ К КЭШ ПАМЯТИ 

При разработке кэш-памяти возникает много вопро¬ 
сов, часть из которых связана с производительностью. 
Некоторые из этих вопросов рассматриваются далее в 
предположении объема оперативной памяти до 16 Мбайт 
и кэш-памяти 64 Кбайта с прямым отображением. 

Сама кэш-память имеет два уровня. Первый образо¬ 
ван блоком тэговых SRAM, содержащим адресную ин¬ 
формацию. В данной кэш-памяти с прямым отображени¬ 
ем 256 адресов отображаются на одну ячейку кэш. Кэш 
содержит копию информации в одной из этих 256 яче¬ 
ек. Отметим, что произведение кэш 64 Кбайт на 256 
адресов в элементе кэш позволяет адресовать 16 Мбайт. 
Второй уровень содержит SRAM данных, хранящих фак¬ 
тические данные, которые скопированы из DRAM. 

32-битный адрес формируемый 80386 разделяется на 
три части. Первые 8 бит должны быть нулевыми, так 
как кэш покрывает память 16 Мбайт. При наличии не¬ 
нулевого значения должен генерироваться особый случай 
прерывания. 
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Следующие 8 бит применяются как поле «тэга», а 
последние 16 бит служат «индексом», показывающим, по 
какому адресу происходит обращение. 

Тэговые SRAM содержат ‘список всех 4-байтных 
«блоков», которые находятся в самой кэш-памяти. «Ин¬ 
декс» сообщает, где в списке находится нужная инфор¬ 
мация. Поле тэга сообщает, какая из 256 возможных 
ячеек памяти для данной ячейки кэш фактически нахо¬ 
дится в кэш. Если информация в кэш содержится, то 
имеет место попадание и данные посылаются в процес¬ 
сор. В противном случае имеет место промах, и запрос 
направляется в оперативную память. 

Кэш на рис. 7.4 имеет ширину 4 байта, т. е. каж¬ 
дая ячейка содержит двойное слово. Можно использовать 
и другую ширину (8 или даже 16 байт), при этом за¬ 
медляется модификация кэш, но увеличивается коэффи¬ 
циент попаданий. 8-байтная кэш имеет коэффициент по¬ 
паданий на несколько процентов выше, чем 4-байтная. 

Тэг Данные 

Адрес: FFFF 

Индекс 1 =8001 | 

Тэг 2>3 =FF > 8ооі 

(Последняя j 

возможная из I 

256 отобранных 0000 
ячеек) 


000012F3 

I 

00000001 


256 адресов 
DRAM 

отображаются 
в один слот 
в Кэш-памяти 


Рис. 7.4 Обращение к Кэш-памяти 

На рис. 7.4 имеются примечания: 

1. 16-битный индекс сообщает, какую ячейку из 

64К ячеек в тэговом SRAM следует проверять. 

2. 8-битный тэг сообщает, какое из 256 возможных 

двойных слов находится в SRAM данных. 

3. Если запрошенный тэг совпадает с тэгом в 

SRAM, возникло попадание. Если нет, происхо¬ 
дит обращение к оперативной памяти и произ¬ 
водится замена тэга и данных на данные, по¬ 
лученные из DRAM. 
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Каждая ячейка основной памяти отображается точно 
на одну ячейку кэш. Если программа повторно обраща¬ 
ется к двум ячейкам по очереди и обе они отображают¬ 
ся на одну и ту же ячейку кэш, возникает «пробуксов¬ 
ка кэш»: проверка в кэш элемента данных 1, не най¬ 
ден, обращение к DRAM, модификация кэш; проверка в 
кэш элемента данных 2, не найден (там элемент 1), 
обращение к DRAM, модификация кэш; проверка в кэш 
элемента данных 1, не найден (там элемент 2), обраще¬ 
ние к DRAM, модификация кэш и т. д. Этой проблемы 
можно избежать, разрешив любой ячейке в основной па¬ 
мяти направляться по мере необходимости в одну из 
двух ячеек кэш-памяти. Теперь контроллер кэш должен 
проверять два места при каждом обращении к; кэш, а 
при помещении нового элемента в кэш решать, какую 
из двух возможных ячеек использовать. Такая двухсто¬ 
ронняя ассоциативность улучшает попадания на 1 % 
(при более дорогой схеме управления). 

Возможно реализовать четырехстороннюю ассоциа¬ 
тивность и даже полностью ассоциативную кэш-память 
(каждая ячейка памяти отображается на любую ячейку 
кэш). Расходы и сложность при этом растут, а увеличе¬ 
ние коэффициента попадания невелико. 


7.2.3. Страничные RAM 

При считывании из памяти двойного слова произво¬ 
дится обращение к 32 микросхемам. Адрес двойного сло¬ 
ва разделяется на номера строки и столбца, сообщающие 
положение нужного бита. Если номер строки в обраще¬ 
ниях не изменяется, то нужно модифицировать только 
номер столбца. 

Простая схема сравнения на старших линиях шины 
адреса может распознать, когда адрес относится к одной 
и той же строке (изменился только номер столбца). Та¬ 
кое обращение можно осуществить быстрее, чем обычно, 
и RAM не будет увеличивать время ожидания. Такой 
способ называется страничной организацией RAM. Его 
действие аналогично наличию кэш-памяти в 512 байт, 
но нет потерь времени из-за промахов, так как ускоря¬ 
ются все обращения в группе из 512 байт. 
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7.2.4. Организация памяти 

Одна из больших проблем для систем на базе 
80386 — обеспечение совместимости с существующими 
16-битными компьютерами и их программным обеспече¬ 
нием. Многие детали программирования 80386 связаны с 
отличиями между 16- и 32-битными операндами и адре¬ 
сацией. 

Как же эти конфликты разрешить аппаратно? Про¬ 
цессор 80386 можно подключить к 16- или 32-битной 
шине данных. Мы рассмотрим обе ситуации; сначала 
рассматривается более простая 32-битная шина данных, 
а затем особенности (скрытые от программиста) подклю¬ 
чения 16-битной шины к 32-битному компьютеру. 

Для программиста память выглядит как последова¬ 
тельность байт; слово — это два соседних байта, а 
двойное слово — 4 соседних байта. 

Фактически же память разделяется на 4 секции по 
байту шириной, поэтому вместо длинного склада из байт 
получаются 4 более коротких склада из байт, причем 
склад имеет свое подключение к шине данных. 

Четыре склада совместно можно считать одним 
складом из двойных слов. На рис. 7.4 показана такая 
организация памяти и подключение 8-битных секций к 
шине данных. Когда процессор 80386 запрашивает из 
памяти двойное слово, из каждого склада берется байт, 
помещается на свою секцию шины данных и посылается 
в процессор. Так за одно обращение к памяти процессор 
80386 получает двойное слово. 

Такое разделение памяти отражается на подключе¬ 
нии процессора. Мы говорим, что процессор имеет 32- 
битную шину адреса, но корпус имеет всего 30 контак¬ 
тов адреса А2—А31. Где же контакты АО и А1? 

Фактически шина адреса показывает, какое двойное 
слово выбрать из памяти, а не какой байт. Контакты 
шины адреса позволяют выбирать из 2 30 двойных слов. 
Мы знаем, что 80386 позволяет выбрать из памяти каж¬ 
дый байт, а также любое двойное слово. Как при выбо¬ 
ре двойного слова выбираются отдельные байты внутри 
него? Можно передать в процессор все двойное слово, а 
затем внутри выбрать нужные байты; однако выбор байт 
производится уже на шине. Процессор имеет 4 контакта 
разрешения байта BE0# —ВЕЗ#. Если контакты адреса 
сообщают о выборе двойного слова, то контакты разре- 
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шения байта сообщают о выборе нужных байт в двой¬ 
ном слове. 

Два младших бита адреса определяют активные сиг¬ 
налы на контактах BE. 

Слово по четному адресу называется «выравненным 
на границе слов»; двойное слово по адресу кратному 4 
называется «выравненным на границе двойных слов». 
Программисты знают, что при задании структур данных 
следует выравнивать слова по границам слов, а двойные 
слова — по границам двойных слов. Рассмотрение взаи¬ 
модействия линий адреса и сигналов BE показывает, 
когда и почему это важно. Если выбирается невыравнен¬ 
ное двойное слово, получить его за одно обращение не¬ 
возможно. Пусть, например, двойное слово находится по 
адресу байта 2; тогда половина его находится в первом 
двойном слове памяти, а вторая половина — во втором; 
поэтому процессор автоматически делает два обраще¬ 
ния. 

Первое обращение дает два старших байта по адре¬ 
сам байт 4 и 5. Для этого адресные контакты выбирают 
второе двойное слово, а активные сигналы BE0# и BE1# 
выбирают первый и второй байты. Второе обращение да¬ 
ет два младших байта по адресам байт 2 и 3 (адрес 
выбирает первое двойное слово, a BE2# и ВЕЗ# выбира¬ 
ют третий и четвертый байты этого двойного слова). 
Байты автоматически упорядочиваются на шине данных, 
но получение двойного слова требует двух циклов об¬ 
ращения к памяти. Если двойное слово выравнено на 
границе двойного слова, контакты адреса выбирают 
двойное слово, а все 4 контакта BE выбирают сразу все 
4 байта. 

Понимание взаимодействия 80386 с 32-битной ши¬ 
ной помогает разобраться с особенностями использова¬ 
ния 16-битной шины. На входной контакт BS16# (раз¬ 
мер шины 16) устройство выдает сигнал, сообщающий 
процессору об обращении к 16-битному устройству. Если 
вся шина данных имеет 16 бит, то сигнал BS16# фор¬ 
мируется при каждом обращении. 

При обращении к 16-битной памяти процессор ис¬ 
пользует только младшие 16 бит шины данных и это 
имеет предсказуемые последствия; слово, выравненное по 
нечетной границе, требует двух обращений для передачи 
в процессор. Двойное слово передается за два обраще¬ 
ния, если оно выравнено на границе слова или двойного 
слова, а двойное слово на нечетной границе требует 
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трех обращений (первое дает один байт, второе — два 
средних байта и третье — оставшийся байт). 

В 16-битных обращениях конвейеризация адреса от¬ 
сутствует, поэтому дополнительные такты на реагирова¬ 
ние памяти не выделяются. 16-битная шина данных с 
микросхемами, имеющими два такта ожидания, может 
вызвать значительные задержки в операциях с частыми 
обращениями к памяти, и правильное выравнивание 
структур данных приобретает еще большее значение. 
Опережающая выборка команд (см. далее) также ухуд¬ 
шается. Более медленная или узкая шина оказывается 
более занятой операционным устройством. Устройство 
опережающей выборки имеет меньше тактов для выбор¬ 
ки кода, что увеличивает вероятность того, что очереди 
опережающей выборки окажутся пустыми, а это замед¬ 
ляет выполнение команд. 

Рассмотренные особенности приводят к формулиров¬ 
ке простых правил для программиста. Все слова необхо¬ 
димо выравнивать по границам слов (обязательно для 
16-битных шин), а двойные слова — по границам двой¬ 
ных слов (обязательно для 32-битных шин). Наконец, 
программа, которая хорошо работает на одном компью¬ 
тере, может работать хуже на другом в зависимости от 
быстродействия микросхем и размера шины. 


КОМПРОМИССЫ РАЗРАБОТКИ 

Улучшение эффективности памяти в части стоимо¬ 
сти и сложности сводятся к двум основным приемам: 
кэширование и все остальное. Если использовать все 
способы второй группы (расслоение, страничные RAM, 
RAM с одним тактом ожидания, 32-битная шина данных 
и конвейеризация адреса), то производительность полу¬ 
чается наилучшей, приближаясь к SRAM. Если же ни 
один из этих способов не используется, то производи¬ 
тельность медленного компьютера можно улучшить, вво¬ 
дя кэш-память. 

В компьютере Compaq 386 кэширование не приме¬ 
няется; в нем есть страничные RAM, эквивалентные 
кэш-памяти 512 байт, и RAM с одним тактом ожидания 
при 16 МГц. В нем же имеется специальная 32-битная 
шина для быстрого доступа к памяти; остальная система 
(средства ввода/вывода и дополнительная память) бази¬ 
руется на 16-битной шине. 
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Несмотря на отсутствие кэширования, производи¬ 
тельность памяти очень хорошая. 

Другие системы все более опираются на Турбо пла¬ 
ты 386. Эти небольшие платы (3*5 дюймов) с процессо¬ 
ром 80386 и вспомогательными микросхемами рассчита¬ 
ны на подключение в IBM PC/AT. Схемы на платах 
отображают контакты 80386 на разъем, который имити¬ 
рует контакты 80286; вам остается удалить 80286 из 
АТ, вставить Турбо плату, и вы получаете систему на 
базе 80386. 

Изготовители Турбо плат не могут влиять на выбор 
RAM и способы организации памяти главного компьюте¬ 
ра, поэтому лучше всего применить SRAM -кэш, которая 
помогает процессору избежать обращений к обычному 
RAM при 90% считываний из памяти. Компьютеры IBM 
PC/AT с такими платами и хорошим жестким диском 
приближаются по производительности к Compaq 386, но 
стоят гораздо дешевле. 

В других системах применяются иные разнообразные 
способы повышения производительности при минималь¬ 
ных расходах на модернизацию. 

Микросхемы с одним тактом ожидания при 16 МГц 
могут иметь два такта ожидания при 20 или 25 МГц. 
Фактически компьютер без кэш-памяти может Иметь 
меньшую производительность при введении более быст¬ 
рого процессора из-за увеличения числа тактов ожида¬ 
ния. Это зависит от множества временных факторов, ко¬ 
торые в каждой системе свои. 

Добавление сопроцессора также ускоряет выполне¬ 
ние программ. Процессор 80386 может использоваться 
совместно с 80287 или 80387; последний процессор при¬ 
мерно в три раза производительнее. 


ИНТЕРФЕЙС ВВОДА-ВЫВОДА 

Термины «ввод/вывод с отображением на память» и 
«ввод/вывод с отображением на ввод/вывод» знакомы 
всем, но что они означают? С аппаратной точки зрения 
они различаются несильно. При обращении к памяти 
или внешним устройствам используются те же схемы 
управления, шина данных и шина адреса. Конечно, уст¬ 
ройство ввода/вывода отличается от памяти, и взаимо¬ 
действие с ним оказывается более гибким. 

Процессор 80386 фактически имеет два реальных 
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адресных пространства (не виртуальный режим). Адрес¬ 
ное пространство памяти содержит 2 32 байт. Оно может 
включать адреса памяти и устройств ввода/вывода. До¬ 
стоинства такого приема: 

1. Размер адресов 32 бита. 

2. Можно использовать любую команду, которая ад¬ 

ресует память, например, AND, OR, TEST. 

Для доступа к устройствам можно использовать 

все режимы адресации. 

3. Пространство ввода/вывода можно защищать с 

помощью сегментов или страниц. 


Второй способ заключается в размещении устройства 
в пространстве ввода/вывода. Это пространство объемом 
64 Кбайт недоступно обращениям большинства команд, 
включая команды пересылки данных. Разделение про¬ 
странств обеспечивает контакт М/ІО, разрешающий ши¬ 
не адреса использовать память или пространство вво¬ 
да/вывода. Для доступа к пространству ввода/вывода 
применяются только команды IN, OUT, INS и OUTS. 

Достоинства такого способа: 

1. Ширина адресов 16 бит, что упрощает их де¬ 

шифрирование. 

2. Пространство ввода/вывода недоступно большин¬ 

ству команд, что служит определенной защи¬ 
той. 


Два способа можно комбинировать, отображая про¬ 
странство ввода/вывода на блок 64 Кбайт адресного про¬ 
странства памяти. В этом случае в системе будут вы¬ 
полняться программы, рассчитанные на любой способ. 
Достоинства адресации обоих способов здесь сохраняют¬ 
ся, а достоинства защиты теряются, например, сегмент¬ 
ная защита не работает против команды OUTS. 
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7.3. ВНУТРЕННЕЕ УСТРОЙСТВО 80386 

Обратимся теперь к устройству самого процессора. 

Рассматриваемый далее материал не зависит от це¬ 
ли использования процессора. Подробное знание процес¬ 
сора поможет в разработке эффективных ассемблерных 
программ. 

7.3.1. Конвейеризация команд 

Самый важный способ ускорения обращения к па¬ 
мяти (конвейеризация) встроен в процессор 80386. 
Обычный процессор выполняет команду в таком порядке: 

1. Выборка команды из памяти. 

2. Дешифрирование команды в стандартную форму 

для операционного устройства. 

3. Выполнение команды. 

Одновременно можно делать только один шаг, поэ¬ 
тому обработка развивается примерно так: 


Интервал 1: выборка команды 1. 

Интервал 2: дешифрирование команды 1. 

Интервал 3: исполнение команды 1. 

Интервал 4: выборка команды 2. 

Интервал 5: дешифрирование команды 2. 

Интервал 6: исполнение команды 2. 

Конвейеризация объединяет эти шаги так, что в 
любой момент времени несколько шагов выполняются 
одновременно. Одна команда выбирается, вторая дешиф¬ 
рируется, а третья исполняется. Чтобы делать это все 
одновременно, сам процессор должен быть разделен на 
полунезависимые устройства, каждое из которых одно¬ 
временно с другими реализует свою функцию. Предста¬ 
вим, что процессор разделен на устройство опережающей 
выборки, дешифратор и операционное устройство, и по¬ 
смотрим, как несколько операций можно производить 
одновременно (см. табл. 7.4). 
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За 6 единиц времени выбраны, дешифрированы и 
исполнены 4 полные команды, а две команды обработа¬ 
ны частично (выбраны и возможно дешифрированы, но 
еще не исполнены). Термин «опережающая выборка» оз¬ 
начает, что команда выбирается одновременно с другими 
действиями, поэтому другие устройства не ожидают за¬ 
вершения выборки. Без конвейеризации за то же время 
будут выполнены только две команды. 

Таким образом, конвейеризация в этом примере по¬ 
зволила за то же время выполнить в два раза больше 
операций. 

Таблица 7.4. Действие конвейеризации 


Такты 

Опережающая 

выборка 

Дешифратор 

Операционное 

устройство 

Интервал 1 
Интервал 2 
Интервал 3 
Интервал 4 
Интервал 5 
Интервал 6 

Команда 1 
Команда 2 
Команда 3 
Команда 4 
Команда 5 
Команда 6 

Команда 1 
Команда 2 
Команда 3 
Команда 4 
Команда 5 

Команда 1 

Команда 2 

Команда 3 

Команда 4 


Однако реальная жизнь сложнее приведенной схемы. 
Опережающая выборка, дешифрирование и исполнение 
занимают разные интервалы времени для различных ко¬ 
манд; иногда исполняемая команда занимает шину дан¬ 
ных, задерживая выборку следующей команды. Кроме 
того, устройство опережающей выборки всегда считывает 
команды последовательно, независимо от результата дей¬ 
ствий команд. Любая команда, нарушающая естествен¬ 
ный порядок (например, JMP или CALL) или прерыва¬ 
ние вызывают освобождение очередей команд. Команда, 
которая обрабатывается сразу после перехода, длится 
дольше, так как операционное устройство должно ожи¬ 
дать ее выборки и дешифрирования. 

Процессор 80386 разделен на устройства, которые 
функционируют следующим образом. Устройство опере¬ 
жающей выборки считывает команды в процессор. Оно 
использует шину, когда она не занята операционным ус¬ 
тройством, считывает команды из памяти и помещает 
их в очередь. 
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Размер очереди — 16 байт (что соответствует 3—7 
командам). 

Устройство дешифрирования преобразует команду в 
формат, стандартный для устройства управления и опе¬ 
рационного устройства. В очереди дешифратора могут 
храниться три команды. Частью дешифрированной ко¬ 
манды является указатель управляющего постоянного за¬ 
поминающего устройства, которое хранит микрокод, уп¬ 
равляющий устройствами 80386. 

Операционное устройство действует по командам от 
устройства управления, фактически выполняя команду. 
Оно содержит арифметико-логическое устройство и набор 
регистров. Сегментное устройство вычисляет адреса и 
контролирует защиту сегментов. Адрес от этого устрой¬ 
ства подается в страничное устройство, которое (если 
страничная организация включена) преобразует его в 
физический адрес; в противном случае используется ад¬ 
рес от сегментного устройства. Это же устройство ис¬ 
пользует устройство опережающей выборки для своих 
запросов и страничное устройство для доступа к табли¬ 
цам страниц в памяти. 

Конвейеризация применяется и в других микропро¬ 
цессорах. Но 80386 уникален в том, что он осуществля¬ 
ет преобразование адреса и контроль защиты для сег¬ 
ментов и страниц внутри микросхемы. В других процес¬ 
сорах для этого применяется отдельная микросхема уп¬ 
равления памятью (MMU). Наличие ее уменьшает про¬ 
изводительность процессора. Кроме того, использование с 
одним процессором разных MMU приводит к проблемам 
совместимости. В процессоре 80386 MMU внутренняя, и 
ее операции совмещаются с операциями других уст¬ 
ройств, поэтому на вычисление адреса дополнительное 
время не расходуется, на число тактов команды влияет 
только фактические обращения к памяти. Некоторые 
сложные методы адресации требуют дополнительного 
такта (см. гл. 2). 


7.3.2. Блоки процессора 80386 

Подробнее остановимся на организации процессора и 
его работе. Мы начнем с обзора устройств, а затем бо¬ 
лее детально рассмотрим каждое устройство. В последней 
части главы показано, как происходит выполнение ко¬ 
манд. 
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УСТРОЙСТВО ОПЕРЕЖАЮЩЕЙ ВЫБОРКИ 

Главная функция этого устройства — использовать 
свободное время шины для считывания команд в процес¬ 
сор. Очередь размером 16 байт хранит команды до их 
считывания дешифратором. Это устройство имеет ни¬ 
зший приоритет по доступу к шине и не знает о том, 
когда переходы или вызовы изменяют естественный по¬ 
рядок выполнения команд. Оно всегда считывает коман¬ 
ды последовательно; фактически оно считывает двойное 
слово и не заботится о том, что оно содержит полные 
команды или части двух команд. Когда осуществляется 
переход, содержимое очередей опережающей выборки и 
дешифрирования очищается. 

Когда производится переход и очереди освобождают¬ 
ся, обработка команд запрещается. Команда выбирается, 
сразу же дешифрируется и затем исполняется. Если есть 
такты, когда шина не занята при дешифрировании и 
исполнении, устройство опережающей выборки начинает 
заполнение очереди. Если первой командой после пере¬ 
хода является команда MUL или другая подобная ко¬ 
манда, устройство быстро заполнит очередь. Например, 
программные циклы выполняются лучше, когда команда 
типа MUL находится в начале цикла. Простые команды 
типа CLC или передачи регистр-регистр выполняются 
так быстро, что они не позволяют устройству опережаю¬ 
щей выборки заполнить очередь, что вносит новые за¬ 
держки. 


УСТРОЙСТВО ДЕШИФРИРОВАНИЯ 

Это устройство также экономит время для всего 
процессора. Так как оно не использует шину, то может 
работать всегда, когда очередь устройства опережающей 
выборки непуста. Каждый байт в команде определяет, 
есть ли еще байты, сообщая дешифратору об окончании 
команды (дешифратор обрабатывает байт за такт). 

Функция дешифратора — преобразовать команды в 
форму, которую может быстро использовать операцион¬ 
ное устройство. Возможный формат дешифрированной 
команды приведен в листинге 7.1. Команда в целом за¬ 
нимает до 112 бит. Первые три бита сообщают о нали¬ 
чии префиксов по принципу «да/нет». Следующие 
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12 бит содержат адрес управляющей ROM микрокода, 
который фактически вызывает исполнение команды. Две¬ 
надцать бит позволяют адресовать 4096 элементов; в уп¬ 
равляющей ROM фактически есть 2560 слов по 37 бит. 


Листинг 7.1. Элемент очереди дешифрированной команды 


Длина 

Значение 

1 

Присутствует префикс LOCK 

1 

Присутствует префикс размера адреса 

1 

Присутствует префикс размера операнда 

12 

Адрес элемента управляющего ROM 

3 

Сегментный регистр 

4 

Номер базового регистра (и бит действительности) 

4 

Номер индексного регистра (и бит действительности) 

2 

Масштабный коэффициент 

32 

Смещение 

32 

Непосредственный операнд 

3 

Операнд-регистр (источник) 

3 

Операнд-регистр (получатель) 

14 

Другие флажки, модификаторы и т. д. 


Следующие трехбитные поля определяют номера 
сегментного регистра, базового регистра и индексного ре¬ 
гистра, используемые командой в адресации. Два бита 
действительности сообщают, преобразуется ли в команде 
базовый и индексный регистры. Двухбитное поле масш¬ 
табного коэффициента допускает масштабы 1, 2, 4 и 8. 

Два больших 32-битных поля содержат смещение и 
непосредственный операнд. Еще два поля определяют ре¬ 
гистры операндов. Из дешифрированной команды опера¬ 
ционное устройство узнает находится ли операнд в па¬ 
мяти, в регистре или является непосредственным значе¬ 
нием. Последние 24 бита содержат флажки, которые 
здесь не рассматриваются. Отметим, что вся дешифриро¬ 
ванная команда — это преобразование машинного язы¬ 
ка, сформированного ассемблером. Если бы код можно 
было записать прямо в этой 112-битной форме, то ас¬ 
семблирование и дешифрирование стало бы ненужным 
(но это очень сложно для восприятия человеком). 
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УСТРОЙСТВО УПРАВЛЕНИЯ 

Это устройство объединяет другие устройства, уп¬ 
равляя их операциями и взаимодействиями. Его ядром 
служит управляющая ROM, содержащая внутренние ко¬ 
манды 80386. Доступ к ROM определяют 12 бит в де¬ 
шифрированной команде. 

Формат микрокодовой команды составляет интеллек¬ 
туальную собственность фирмы Intel. 

Однако кое-какие общие факты о нем известны. 
Наличие управляющих слов в ROM упрощает отладку 
всего процессора. Изменять ROM не так легко, но все 
же легче, чем все остальное в процессоре. Даже серьез¬ 
ные ошибки в процессоре часто «ремонтируются» путем 
репрограммирования ROM и обхода ошибки, а не изме¬ 
нением устройства самой микросхемы. 

37-битовые слова микрокода довольно узкие. Широ¬ 
кие управляющие слова содержат достаточно информа¬ 
ции для одновременного прямого управления каждым ус¬ 
тройством процессора. Используемые узкие слова, по-ви¬ 
димому, одновременно управляют только устройством. 
Так как устройство опережающей выборки команд и де¬ 
шифратор реализуют простые операции, можно предпо¬ 
ложить, что большая часть слов в ROM управляют дей¬ 
ствиями других устройств, в частности операционным 
устройством. 

Устройство управления, наряду с шинным устройст¬ 
вом, взаимодействует с внешним миром. Входные сигна¬ 
лы подаются в схему приоритетов запросов, которая со¬ 
общает процессору, когда что делать. Это очень важно, 
так как в любой момент времени на разных этапах об¬ 
работки могут находиться 6 или 7 команд и данный 
процессор может быть частью мультипроцессорной систе¬ 
мы, в которой шиной управляют несколько компонент. 

Следующие три устройства довольно сложные. Мы 
кратко рассмотрим их, ориентируясь на аппаратные де¬ 
тали. В следующем параграфе описано, как работают и 
взаимодействуют эти устройства. 

ВРЕМЕННЫЕ СООТНОШЕНИЯ 

Эти соотношения довольно сложные, но здесь дейст¬ 
вуют некоторые основные правила. Пересылка информа¬ 
ции из одной очереди в другую, из очереди в регистр и 
из одного регистра в другой длится один такт. Инфор- 



Внутренняя организация процессора 80386 


323 


мация должна поступить в одно из этих мест хранения 
до начала следующего такта, иначе она может быть из¬ 
менена новыми данными, появившимися на внутренней 
шине. Любая пересылка между регистрами (включая и 
внутренние регистры 80386) занимает один такт, незави¬ 
симо от того, сколько сумматоров, мультиплексоров и т. 
д. находится между регистрами. Такие одиночные такты 
необязательно отражаются на общем времени выполне¬ 
ния команды, так как многие из них совмещаются с 
другими операциями. Заметные задержки вносит получе¬ 
ние операндов из памяти (4 плюс дополнительные так¬ 
ты) и использование операнда в памяти как получателя. 
На это уходит 5 тактов: четыре на получение операнда 
и один для записи в память. Второй такт записи можно 
совместить с обработкой операционным устройством сле¬ 
дующей команды. 

ОПЕРАЦИОННОЕ УСТРОЙСТВО 

Операционное устройство состоит из следующих 
блоков: модуля регистров (со всеми общими и управля¬ 
ющими регистрами) и математического устройства 
(включая сдвигатель, сумматор и специальные схемы 
для умножения и деления). Операционное устройство 
имеет два входа: вход от шинного устройства содержит 
операнды команды из памяти, а вход от дешифратора 
содержит непосредственные операнды и смещения для 
операндов. Мультиплексор выбирает один из этих входов 
и направляет его содержимое в регистр или временный 
регистр для использования в будущем. 

Значения из регистров можно передать в сегментное 
устройство для адресных вычислений или использовать в 
арифметической секции. 

Рассмотрим, например, команду ADD 
ЕАХ, MEM,DWORD. Операнд MEM,DWORD считывается 
шинным устройством и помещается во временный ре¬ 
гистр (это занимает 4 цикла шины, так как операнды 
берутся из памяти во время выполнения). Затем оба 
операнда подаются в арифметическую секцию, где они 
суммируются, и результат помещается в специальный 
регистр AR_OUT. Суммирование и загрузка AR_OUT 
занимают один цикл шины. Второй цикл шины необхо¬ 
дим для возвращения результата из AR_OUT в ЕАХ. 

Операционное устройство не может больше ничего 
делать до передачи результата из AR_OUT в ЕАХ, так 
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как следующая команда может использовать ЕАХ. Если 
новое значение еще не передано в регистр, следующая 
команда может использовать старое значение, пока но¬ 
вое значение передается по шине в ЕАХ. Такая ситуа¬ 
ция (команде требуется значение, которое еще не поме¬ 
щено туда, куда нужно) называется блокировкой. Так 
как в 80386 нет схемы определения такой ситуации, он 
просто занимает два цикла шины даже для простейшей 
операции (типа передачи из регистра в регистр), избегая 
этим блокировки. 

80386 обеспечивает лучшую производительность, чем 
16-битные процессоры, работая с данными вдвое больше¬ 
го размера. Часть этих возможностей реализована аппа¬ 
ратно. Например, параллельный сдвигатель имеет шири¬ 
ну 64 бита. Он обеспечивает 32-битный сдвиг 32-битного 
операнда за один такт. Улучшено кодирование некото¬ 
рых команд. Например, команда MUL длится от 9 до 38 
тактов: 6 тактов плюс один такт на каждый значащий 
бит множителя (минимум 3). Умножение на 3 (старший 
бит во втором разряде) занимает (6+3) 9 тактов. Умно¬ 
жение на число с единицей в старшем бите длится 
(6+32) 38 тактов. Простые операции выполняются очень 
быстро. 

Большинство операций, например, сложение, выпол¬ 
няются с одинаковой скоростью независимо от размера 
операндов. 


УСТРОЙСТВО СЕГМЕНТАЦИИ 

Адрес памяти из операционного устройства состоит 
из двух значений: смещения и индекса. Эти два числа 
суммируются и сохраняются во временном регистре. Ес¬ 
ли требуется база (т. е. адрес имеет базу, индекс и 
смещение), результат нужно вновь подать на сумматор 
и сложить с базой, полученной от операционного уст¬ 
ройства. Это занимает лишний такт независимо от того, 
масштабируется индекс или нет. Результатом сложения 
является эффективный адрес, который служит относи¬ 
тельной частью адреса. 

Устройство сегментации сравнивает эффективный 
адрес с пределом длины используемого сегмента из де¬ 
скриптора сегмента. Все необходимые дескрипторы теку¬ 
щих сегментов хранятся в процессоре 80386. Права до¬ 
ступа также сопоставляются с операциями процессора и 
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при их несоответствии возникает прерывание. Если кон¬ 
троль защиты прошел успешно, база сегмента прибавля¬ 
ется к эффективному адресу, давая линейный адрес. Ес¬ 
ли страничная организация блокирована, этот адрес при¬ 
меняется для обращения к памяти как физический ад¬ 
рес. 


СТРАНИЧНОЕ УСТРОЙСТВО 

В простых системах страничная организация не 
применяется, и это устройство блокировано. Но если оно 
задействовано, то должно очень быстро выполнять свои 
операции, чтобы не замедлять процессор. Это довольно 
трудная проблема, так как каждая страница имеет ин¬ 
формацию о защите и адресации; при страничном кадре 
4 Кбайта даже сравнительно небольшое адресное про¬ 
странство 16 Мбайт содержит 4 Кбайта страниц. Необ¬ 
ходимую информацию для всех страниц невозможно 
хранить в процессоре и приходится привлекать опера¬ 
тивную память. 

Структура памяти состоит из двух частей: каталога 
страниц (он сообщает, где находится информация о 
каждой странице) и таблицы страниц (она содержит де¬ 
скрипторы для каждой страницы). Для получения нуж¬ 
ной страницы необходимо считать каталог страниц, ко¬ 
торый помогает образовать адрес для считывания табли¬ 
цы страниц, которая дает необходимую информацию для 
нахождения фактической страницы. Как же реализовать 
страничную организацию без больших задержек обраще¬ 
ния к памяти? 

Решение подобно кэшированию памяти: хранить ча¬ 
сто используемую информацию в небольшой и быстрой 
кэш-памяти. Кэш-страница находится в страничном уст¬ 
ройстве и называется страничной кэш-памятью или бу¬ 
фером преобразования TLB. Название происходит от 
способа «заглядывания» в буфер страничным устройством 
для проверки необходимой адресной информации до об¬ 
ращения к каталогу страниц в памяти. 

Разработчики микропроцессора поместили на кри¬ 
сталле (275000 транзисторов) множество блоков. После 
размещения устройств опережающей выборки, общих ре¬ 
гистров и страничного устройства осталось место только 
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для. одной кэш-памяти. В кэш можно хранить код, ад¬ 
ресную информацию и данные. Разработчики 80386 вы¬ 
брали внутреннюю кэш для адресации (TLB) в странич¬ 
ном устройстве. 

TLB имеет четыре комбинации по восемь элементов 
(см. рис. 7.5). Каждый элемент TLB имеет две части. 
Первая называется VAh — это старшие 17 бит вирту¬ 
ального адреса страницы. Вторая часть — это копия 
фактического 32-битного элемента таблицы страниц, ко¬ 
торый обычно должен считываться из памяти. 

Следующий материал более сложен. Но если вы хо¬ 
тите узнать, как работает TLB, прочитайте его. Три би¬ 
та виртуального адреса (биты 14—12) дают смещение от 
0 до 7. Напомним, что TLB имеет четыре комбинации 
по восемь элементов, поэтому данные три бита адресуют 
по одному элементу из каждой комбинации. 

Каждый из четырех элементов считывается одновре¬ 
менно. Старшие 17 бит текущего виртуального адреса 
сравниваются с 17-битным полем VAh в каждом элемен¬ 
те. При наличии соответствия элемент таблицы страниц, 
присоединенный к элементу TLB, как раз является нуж¬ 
ным, и обращение к памяти не требуется. 

Но вы можете сказать: «Стоп! 17 бит виртуального 
однозначного адреса недостаточно для определения лю¬ 
бой страницы. Требуется 20 бит». Однако 17 бит вирту¬ 
ального адреса, объединенные с тремя битами индекса 
TLB как раз и дают 20 бит. 

Это означает, что каждая страница в памяти ото¬ 
бражается на один из 8 уровней смещения в TLB. При 
копировании в TLB страница должна быть помещена на 
соответствующий уровень смещения; схемно определяет¬ 
ся, в какую комбинацию она направляется. 

Обнаружение соответствия называется страничным 
попаданием. Примерно 98% адресов страничной памяти 
дают попадание. Напомним, что 32 элемента TLB по¬ 
зволяют адресовать (32 элемента * 4 Кбайта в страни¬ 
це) 128 Кбайт памяти. Так как большинство программ 
большую часть времени используют одни и те же стра¬ 
ницы, то такая кэш обеспечивает большое число попада¬ 
ний. Промахи заставляют процессор обратиться к памяти 
за информацией о странице; для этого необходимы два 
отдельных обращения к памяти. Прикладной програм¬ 
мист не может влиять на процент попаданий, так как 
программа вообще может выполняться без использования 
страниц. 
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Однако следует учитывать, что программы с перехо¬ 
дами через большие области данных (более 128 Кбайт) 
вызывают больше промахов, чем другие. 

Страничное устройство формирует физический адрес. Это 
формирование производится тремя способами: страничная 
организация выключена и используется линейный адрес; 
попадание в TLB позволяет построить и проверить нуж¬ 
ный адрес без дополнительных обращений к памяти; 
промах в TLB вызывает дополнительные обращения к 
памяти, которые необязательно нарушают конвейериза¬ 
цию и замедляют процессор. 

ШИННОЕ УСТРОЙСТВО 

Это устройство управляет всем взаимодействием 
процессора 80386 с внешним миром (за исключением 
некоторых сигналов устройства управления). 

Шинное устройство воспринимает запросы данных 
от операционного устройства и выборки кода от устрой¬ 
ства опережающей выборки, упорядочивает их по при¬ 
оритетам (выборка кода последняя) и выполняет их. Это 
же устройство управляет взаимодействием с сопроцессо¬ 
рами и другими микросхемами, которые могут управлять 
системной шиной. 


7.3.3. Выполнение команд в 80386 

В этом разделе суммируется материал о внутренних 
операциях 80386 на примере выполнения двух команд. 
Показано, что происходит в процессоре в каждом такте 
по мере прохождения двух команд. В листинге 7.2 при¬ 
ведены две команды. 


Листинг 7.2. Пример команд 


Адрес 

Содержимое (код) 

Команда 

00120000 

03 D9 

ADD ЕВХ, ЕСХ 

00120002 

64: 2В В4 DA 01234567 

SUB ESI, FS: 01234567Н 



|EDX] |EBX*8] 

0012000А 
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Ради простоты положим, что код выполняется сразу 
после команды перехода, очищающей конвейер 80386 (в 
частности очереди опережающей выборки и дешифриро¬ 
вания). 

Устройство опережающей выборки начинает с вы¬ 
борки первого двойного слова командного потока (код по 
адресу 00120000 и далее) и запоминает четыре байта в 
своей очереди. Это устройство использует свободные 
циклы шины для заполнения своей очереди и продолжа¬ 
ет выборку, когда очередь начинает освобождаться. Да¬ 
лее мы не будем останавливать внимание на этом уст¬ 
ройстве, так как его работа довольно проста. 

ТАКТ 1 

ADD: Устройство дешифрирования начинает рабо¬ 
тать, как только в очереди опережающей выборки появ¬ 
ляется первый байт. Оно берет этот байт (со значением 
03) и дешифрирует его, помещая информацию в очередь 
дешифрированных команд (указатель очереди адресует 
первый пустой элемент в очереди дешифратора). Первый 
байт сообщает дешифратору о том, что командой явля¬ 
ется ADD и что она имеет байт ModRM, указывающий 
на продолжение команды. 

ТАКТ 2 

ADD: Дешифратор берет байт 2 из устройства опе¬ 
режающей выборки; это байт ModRM команды ADD со 
значением D9. Байт сообщает об использовании регист¬ 
ров ЕВХ и ЕСХ и об окончании команды. Дешифриро¬ 
ванная команда отмечается готовностью READY и оста¬ 
ется в очереди для исполнения устройством управления. 
Указатель очереди продвигается на следующий пустой 
элемент; это происходит после успешного дешифрирова¬ 
ния каждой команды. 


ТАКТ 3 

ADD: В конвейере нет предыдущих неисполненных 
команд, поэтому команда ADD начинает исполняться не¬ 
медленно. Первое микрослово считывается из управляю¬ 
щей ROM и два операнда ЕВХ и ЕСХ считываются из 
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регистрового файла в операционном устройстве на шины 
смещения и индекса. 

Во второй половине такта два значения подаются в 
ALU и микрокод определяет их сложение. Результат по¬ 
мещается в регистр AR_OUT. 

SUB: Дешифратор «видит», что команда SUB имеет 
префикс FS замены сегмента (значение 64). Поле сег¬ 
ментного регистра в очереди изменяется на определение 
FS вместо принимаемого по умолчанию DS. 


ТАКТ 4 

ADD: В первой части такта в операционном устрой¬ 
стве ничего не происходит. Во второй части такта со¬ 
держимое AR_OUT записывается в ЕВХ, и флажки в 
EFlags модифицируются, отражая особенности результата 
команды ADD. На этом команда ADD закончена. Отме¬ 
тим, что время выполнения команды ADD составляет 
два такта, а у нас получилось четыре; объясняется это 
тем, что конвейеризация в нашем примере исключена. 

SUB: Дешифратор преобразует байт команды SUB 
(значение 2В), показывающий наличие байта ModRM. 

Если бы эта команда была полностью дешифрирова¬ 
на, смещение в обход регистрового файла было бы вы¬ 
дано на шину смещения, а индекс или база считывались 
бы из регистрового файла на шину индекса. 


ТАКТ 5 

Все такты после этого относятся к команде SUB. 
Дешифратор преобразует байт ModRM (значение 
В4), который показывает наличие байта SIB. Обычно 
это дешифрирование совмещается с выполнением другой 
команды, но у нас очередь освобождена командой JMP. 


ТАКТ 6 

Дешифратор преобразует байт SIB (значение DA), 
показывающий наличие 4-байтного смещения. 
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ТАКТ 7 

Дешифратор помещает 4-байтное смещение (значе¬ 
ние 01234567Н) прямо в поле смещения элемента очере¬ 
ди для команды SUB. Теперь дешифрирование команды 
SUB закончено. 


ТАКТ 8 

Смещение обходит модуль регистров и помещается 
на шину смещения, а индекс считывается из регистрово¬ 
го файла (ЕВХ) и помещается на шину индекса. 

В конце такта индекс умножается на 8 и прибавля¬ 
ется к смещению; результат направляется в запоминаю¬ 
щий регистр устройства сегментации. 


ТАКТ 9 

Определен базовый регистр в дополнение к уже вы¬ 
численному смещению и индексу, поэтому база (EDX) 
считывается из регистрового файла; предыдущий резуль¬ 
тат берется из запоминающего регистра и два числа 
складываются в сумматоре. Этот дополнительный такт 
нужен, когда в командах используется база, смещение и 
индекс. 

Отметим, что при наличии команды после SUB она 
была бы теперь уже выбрана и дешифрирована и до¬ 
стигла бы операционного устройства. 


ТАКТ 10 

Указанный сегментный регистр FS берется из моду¬ 
ля регистров, и граница этого сегмента сравнивается с 
эффективным адресом в запоминающем регистре, а дру¬ 
гая схема проверяет, можно ли считывать из этого сег¬ 
мента (права доступа), так как результат записывается 
в регистр. 

Во второй части такта базовый адрес сегмента чи¬ 
тается из дескриптора сегмента и прибавляется к эф¬ 
фективному адресу, давая линейный адрес; он помеща¬ 
ется в запоминающий регистр страничного устройства. 
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ТАКТ 11 

Линейный адрес используется для обращения к TLB 
(мы считаем, что происходит попадание), и физический 
адрес операнда находится путем слияния старших 
20 бит из элемента TLB (который именует страничный 
кадр) и младших 12 бит линейного адреса (которые оп¬ 
ределяют байт внутри страницы). 

В конце такта результирующий физический' адрес 
помещается в запоминающий регистр. 

ТАКТЫ 12—14 

Мы полагаем, что шинное устройство свободно и 
память имеет один такт ожидания (3-тактная память). 
Этот такт расходуется на считывание данных из памяти. 
Отметим, что обращения к памяти, которые являются 
частью выполнения команды, не конвейеризуются. В 
конце такта 14 данные находятся в шинном устройстве, 
откуда их можно читать. 

ТАКТ 15 

Данные из памяти подаются на один вход ALU, 
значение из ESI подается на второй, и производится вы¬ 
читание с помещением результата в AR_OUT. 

ТАКТ 16 

В первой половине такта ничего не происходит; во 
второй половине новое значение записывается из 
AR_OUT в ESI, и устанавливаются флажки. 


7.4. ПРИМЕРЫ СЛОЖНЫХ КОМАНД 

Приведенный выше пример включает в себя двух¬ 
байтную команду ADD, которая выполняется за четыре 
такта, и восьмибайтную команду SUB, которая требует 
еще 12 тактов. В листинге 7.3 приведены более сложные 
команды 80386. Сокращения AS, OS и FS означают пре¬ 
фиксы размера адреса и замены сегмента. 



Внутренняя организация процессора 80386 333 


Листинг 7.3. Сложные команды 


КОМАНДА 1: LOCK: AS: OS: FS: BTS 12345678H |EDI] |EBX*4], 
24 

КОД: FO: 67: 66: 64: OF BA 94 9F 12345678 18 

КОМАНДА 2: LOCK: AS: OS: FS: ADD 12345678H [EDI] 

[EBX*4|, 9ABCDE02H 

КОД: FO: 67: 66: 64: 81 84 9F 12345678 9ABCDE02 


Команда 1 длиной 13 байт требует 10 тактов на 
дешифрирование и 9 тактов на выполнение. Команда 2 
длиной 15 байт дешифрируется 9 тактов и выполняется 
8 тактов. Интересно, что в обоих командах дешифриро¬ 
вание длится дольше выполнения. 


7.5. ОСОБЕННОСТИ 
ПРОГРАММИРОВАНИЯ 

Ниже приведены некоторые простые правила разра¬ 
ботки эффективных прикладных программ для исполне¬ 
ния процессором 80386. 


1. Минимизировать вызовы 05. 

Один вызов OS связан с выполнением тысяч 
байт кода; в системе на базе 80386 программы 
OS могут выполняться под гипервизором, уп¬ 
равляющим системными ресурсами. Вызов OS 
может привести к вызову гипервизора, что вно¬ 
сит еще большие задержки. 

2. Выравнивать модули программы на границах 

страниц. 

Такой прием в системе страничной памяти по¬ 
могает предотвратить свопинг страниц. 

3. Обеспечить локальность обращений. 

Локальность важна для кэш-памяти, странич¬ 
ных RAM, устройства опережающей выборки, 
очереди TLB и др. Программы из небольших 
компактных модулей выполняются эффективнее, 
так как позволяют использовать встроенные в 
процессор средства ускорения. 
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4. Помещать команды с быстрым дешифрировани¬ 

ем и долгим выполнением в начале цикла. 
Примером таких команд служит умножение. 
Такие команды помогают процессору заполнить 
очереди после выполнения перехода. 

5. Адреса переходов выравнивать по двойным сло¬ 

вам. 

При этом процессор, замедленный командой пе¬ 
рехода, не делает дополнительных обращений к 
памяти для считывания первой команды после 
перехода. 

6. Выравнивать операнды в памяти по их естест¬ 

венным границам. 

Это ускоряет обращения к памяти. 

7. Массивы и другие большие структуры данных 

выравнивать по границам двойных слов и да¬ 
же страниц. 

Этим ускоряется доступ к массивам. Выравни¬ 
вание по странице следует рассмотреть, когда 
массив или другая структура достигает 2 Кбайт 
(половина страницы). При этом ускоряется до¬ 
ступ внутри структуры и повышается произво¬ 
дительность в системе виртуальной памяти со 
страничной организацией. 



УВАЖАЕМЫЕ ГОСПОДА! 


Акционерное издательское предприятие "КОНКОРД" 
имеет честь предложить вам свое сотрудничество в изда¬ 
нии переводов справочников, каталогов и научно-техни¬ 
ческой литературы по новым информационным техноло¬ 
гиям. 

Фирма имеет штат технических переводчиков и ре¬ 
дакторов, имеющих большой опыт практической работы 
в следующих областях: компьютерная и микропроцессор¬ 
ная техника, объектно-ориентированное программирова¬ 
ние. 


В издательстве "КОНКОРД" с разрешения москов¬ 
ского представительства фирмы Интел Текнолоджиз пе¬ 
реведено и издано на русском языке справочное руко¬ 
водство «Продукция фирмы INTEL» («Product Overview 
1992»). 

«КОНКОРД» подготовил к изданию книгу Гради 
Буча «Объектно-ориентированное программирование с 
примерами применения» на русском языке. 

Фирма принимает заявки на разработку рекламных 
сообщений и размещение рекламы в своих изданиях. 

Фирма заинтересована в установлении долговремен¬ 
ных взаимовыгодных связей с российскими и зарубежны¬ 
ми деловыми партнерами, занимающимися распростране¬ 
нием современных технологий, и готова сотрудничать с 
ними. 

Контактные телефоны: 459-22-93, 191-61-33. 

Факс: 459-22-93. 












































































